CN113913405A - 一种编辑核酸的系统及方法 - Google Patents

一种编辑核酸的系统及方法 Download PDF

Info

Publication number
CN113913405A
CN113913405A CN202110780360.8A CN202110780360A CN113913405A CN 113913405 A CN113913405 A CN 113913405A CN 202110780360 A CN202110780360 A CN 202110780360A CN 113913405 A CN113913405 A CN 113913405A
Authority
CN
China
Prior art keywords
nucleic acid
acid molecule
grna
dna polymerase
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110780360.8A
Other languages
English (en)
Inventor
李伟
周琪
王晨鑫
方森
焦贯怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute Of Stem Cell And Regenerative Medicine
Institute of Zoology of CAS
Original Assignee
Beijing Institute Of Stem Cell And Regenerative Medicine
Institute of Zoology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute Of Stem Cell And Regenerative Medicine, Institute of Zoology of CAS filed Critical Beijing Institute Of Stem Cell And Regenerative Medicine
Publication of CN113913405A publication Critical patent/CN113913405A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本申请涉及用于编辑核酸的系统和试剂盒及其用途,以及编辑核酸的方法。本申请的系统、试剂盒和方法可用于断裂双链靶核酸并在其末端形成悬突,并且可用于在感兴趣的核酸分子(例如基因组DNA)中插入靶核酸或将感兴趣的核酸分子(例如基因组DNA)中的核苷酸片段置换为靶核酸。

Description

一种编辑核酸的系统及方法
技术领域
本申请涉及基因工程和分子生物学领域。特别地,本申请涉及用于编辑核酸的系统和试剂盒及其用途,以及编辑核酸的方法。本申请的系统、试剂盒和方法可用于断裂双链靶核酸并在其末端(特别是断裂的末端)形成悬突,并且可用于在感兴趣的核酸分子(例如基因组DNA)中插入靶核酸或将感兴趣的核酸分子(例如基因组DNA)中的核苷酸片段置换为靶核酸。
背景技术
基因编辑技术是生物医学研究的热门领域,在遗传性疾病的临床治疗、动物模型的构建、农作物的遗传育种等方面具有广阔的应用前景。基因编辑技术包括在基因组特异位点上,对单个核苷酸或一段DNA序列进行删除、添加和替换等操作。外源基因的定点敲入可以通过同源重组(HDR,homologous dependent recombination)实现:在外源基因的两侧各引入一段500-3000bp的同源臂,可以实现外源基因精确的定点整合,但其效率极低,只有0.01%左右。通过人工构建的核酸酶如ZFN(zinc-finger nucleases)、TALEN(transcription activator-like effector nucleases)或CRISPR/Cas9(clusteredregularly interspaced short palindromic repeats/CRISPR-associated protein-9nuclease)在基因组的靶向位点进行切割,产生DNA双链断裂(DSB,double strandbreak),可以促进同源重组介导的外源基因的定点敲入。但由于大多数哺乳动物细胞主要依靠NHEJ(non-homologous end joining)进行DSB修复,基于核酸酶和同源重组的定点敲入效率依然很低,一般在1%左右。此外,由于同源重组只发生在细胞周期的S/G2期,对于处于终末分化阶段的大多数体细胞则无法通过以上方法实现外源基因的定点整合。
以线性单链DNA为供体也可以实现外源DNA片段的定点整合。单链DNA供体的两端各有一段30-50nt的同源臂,核酸酶在基因组的特异位点切割后,单链依靠SDSA(synthesisdependent strand annealing)的方式整合到DSB位点,从而实现基因组特异位点的整合。线性单链DNA相比HDR更加高效,但不够精确:单链DNA的5’端的接头处常常发生额外的碱基插入和缺失。此外,长片段的线性DNA单链化学合成的成本很高,不易获得。因此,这种方法不适用于大片段(大于1Kb)的外源基因的定点敲入。除此之外,当插入片段超过1Kb,其整合效率也会显著降低。
基于NHEJ的定点敲入,如HITI(Homology-independent target integration)技术,不依赖外源基因两端的同源臂,其中,核酸酶在切割基因组上特异位点的同时也切割供体载体,随后线性化的外源基因DNA片段通过NHEJ DNA修复通路插入到基因组的断裂位点。基于NHEJ的定点敲入不具有方向性,且接头的位置常常不精确,容易产生额外的碱基插入或缺失。基于MMEJ的定点敲入方法是在NHEJ基础上,在外源基因的两端引入微同源臂,但效率仍然很低。
Prime Editing是一种新型基因编辑方法。该方法使用由具有H840A突变的spCas9(nCas9)与逆转录酶MLV-RT(Murine Leukemia Virus-Reverse Transcriptase)构成的融合蛋白,以及由gRNA(guide RNA)改造而来的PegRNA(Prime editing guide RNA),可以实现任意单碱基的转换/颠换或者小片段DNA的删除、添加及替换。PegRNA是在gRNA的3’端引入一段PBS(Prime binding site)序列以及一段模板序列而产生的,其中,模板序列含有编辑序列和一段基因组DSB位点的同源序列。在该方法中,由nCas9与PegRNA形成的复合物结合到基因组靶向位点并切割PAM链,随后PegRNA上的PBS序列与PAM链上游离出来的3’末端互补配对,然后MLV-RT以PegRNA的模板序列为模板,在PAM链切口处的3’末端逆转录延伸出编辑序列和同源序列。随后,经过DNA单链的置换和错配修复等过程,可以在切口处完成修复并将编辑序列整合到靶向位点。由于H840A nCas9只切割双链DNA的一条链(即PAM链),不会产生DSB引发NHEJ,因此,该方法不易引入额外的碱基缺失或插入,编辑的精确度高。但是,由于PegRNA上模板序列的长度限制了可编辑序列的长度,Prime Editing仅适用于小于100bp的碱基序列的删除或敲入。
因此,建立一种能够高效进行基因定点敲入和置换的方法,特别是能够高效进行大片段(大于1Kbp)外源基因的插入和置换的方法,对于拓展基因编辑技术在生产以及医疗中的应用至关重要。
发明内容
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的核酸化学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
术语“Cas蛋白”或“Cas核酸酶”是一种RNA引导的核酸酶。Cas蛋白也被称为casn1核酸酶或CRISPR相关核酸酶。CRISPR(聚簇规则间隔短回文重复)是一种适应性免疫系统,其提供针对移动遗传元件(病毒、转座元件和接合质粒)的保护。CRISPR簇含有重复序列(repeat)和间隔序列(spacer),其中,间隔序列是与移动遗传元件互补的序列,能够靶向侵入核酸。CRISPR簇被转录并加工成CRISPR RNA(crRNA)。在II型CRISPR系统中,对pre-crRNA的正确加工还需要反式编码的小RNA(tracrRNA)的参与。因此,在自然界中,II型CRISPR系统对DNA的切割需要Cas蛋白和两种RNA。但是,通过工程化可以将crRNA和tracrRNA并入单一引导RNA(简称“sgRNA”或“gNRA”)中。参见例如Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),其全部内容通过引用并入本文。
如本文中所使用的,术语“互补”意指,两条核酸序列能够根据碱基配对原则(Waston-Crick原则)在彼此之间形成氢键,并由此形成双链体。在本申请中,术语“互补”包括“实质上互补”和“完全互补”。如本文中所使用的,术语“完全互补”意指,一条核酸序列中的每一个碱基都能够与另一条核酸链中的碱基配对,而不存在错配或缺口。如本文中所使用的,术语“实质上互补”意指,一条核酸序列中的大部分碱基都能够与另一条核酸链中的碱基配对,其允许存在错配或缺口(例如,一个或数个核苷酸的错配或缺口)。通常,在允许核酸杂交、退火或扩增的条件下,“互补”(例如实质上互补或完全互补)的两条核酸序列将选择性地/特异性地发生杂交或退火,并形成双链体。
如本文中所使用的,术语“DNA聚合酶”是指,能够以一条核酸链(例如DNA链或RNA链)为模板合成另一条核酸链(DNA链)的酶。在本申请中,DNA聚合酶可以是依赖于DNA的DNA聚合酶(即,能够以DNA链为模板合成互补的DNA链的酶),也可以是依赖于RNA的DNA聚合酶(即,能够以RNA链为模板合成互补的DNA链的酶)。在某些实施方案中,本申请所使用的DNA聚合酶为依赖于RNA的DNA聚合酶,例如逆转录酶。
如本文中所使用的,术语“逆转录酶(RT)”是指能够以RNA链为模板合成互补的DNA链的酶。本申请的逆转录酶包括但不限于,来自逆转录病毒或其它病毒或细菌的逆转录酶,以及具有逆转录活性的DNA聚合酶,如TTH DNA聚合酶,Taq DNA聚合酶,TNE DNA聚合酶,TMADNA聚合酶等。来自逆转录病毒的逆转录酶包括但不限于,来自Moloney鼠白血病病毒(M-MLV),人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶。逆转录酶的具体实例还可参见例如,美国专利申请2002/0198944(其全文通过引用方式并入本文)。另外,本申请的逆转录酶包括但不限于任何形式,例如,天然存在的逆转录酶,天然存在的突变体逆转录酶,工程化突变体逆转录酶或其它变体(例如,保留其逆转录活性的截短变体)。
如本文中所使用的,术语“杂交”和“退火”意指,互补的单链核酸分子形成双链核酸的过程。在本申请中,“杂交”和“退火”具有相同的含义,并且可互换使用。通常,完全互补或实质上互补的两条核酸序列可发生杂交或退火。两条核酸序列发生杂交或退火所需要的互补性取决于所使用的杂交条件,特别是温度。
如本文中所使用的,“允许核酸杂交的条件”具有本领域技术人员通常理解的含义,并且可通过常规的方法来确定。例如,具有互补序列的两条核酸分子可在合适的杂交条件下发生杂交。此类杂交条件可涉及下列因素:温度,杂交缓冲液的pH值、成分和离子强度等,并且可根据互补的两条核酸分子的长度和GC含量来确定。例如,当互补的两条核酸分子的长度相对较短和/或GC含量相对较低时,可采用低严紧的杂交条件。当互补的两条核酸分子的长度相对较长和/或GC含量相对较高时,可采用高严紧的杂交条件。此类杂交条件是本领域技术人员熟知的,并且可参见例如Joseph Sambrook,et al.,Molecular Cloning,ALaboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2001);和M.L.M.Anderson,Nucleic Acid Hybridization,Springer-Verlag New YorkInc.N.Y.(1999)。在本申请中,“杂交”和“退火”具有相同的含义,并且可互换使用。相应地,表述“允许核酸杂交的条件”和“允许核酸退火的条件”也具有相同的含义,并且可互换使用。
如本文中所使用的,术语“上游”用于描述两条核酸序列(或两个核酸分子)的相对位置关系,并且具有本领域技术人员通常理解的含义。例如,表述“一条核酸序列位于另一条核酸序列的上游”意指,当以5'至3'方向排列时,与后者相比,前者位于更靠前的位置(即,更接近5'端的位置)。如本文中所使用的,术语“下游”具有与“上游”相反的含义。
如本文中所使用的,术语“接头”是指,用于连接两个实体元件(例如两个核酸或两个多肽)的化学实体。例如,用于连接两个多肽的接头可以为肽接头(例如,包含多个氨基酸残基的接头);用于连接两个核酸的接头可以为核酸接头(例如,包含多个核苷酸的接头)。
如本文中所使用的,术语“引导序列”是指导向RNA包含的靶向序列。在某些情况下,引导序列是与靶序列具有足够互补性,从而能够与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的多核苷酸序列。在某些实施方案中,引导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定两条核酸序列的互补性的方法在本领域普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
如本文中所使用的,术语“支架序列”是指导向RNA中被Cas蛋白识别并结合的序列。在某些情况下,支架序列可包含或者由CRISPR的重复序列组成。
如本文中所使用的,术语“功能性复合物”是指,导向RNA(guide RNA或gRNA)与Cas蛋白结合所形成的复合体,其能够识别并切割与该导向RNA的多核苷酸。
如本文中所使用的,术语“靶核酸”或“靶序列”是指导向序列所靶向的多核苷酸,例如与该导向序列具有互补性的序列。导向序列与靶序列的完全互补性不是必需的,只要存在足够互补性以引起二者杂交并且促进CRISPR/Cas复合物的结合即可。靶序列可以包含任何多核苷酸,如DNA或RNA。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。
在本发明中,表述“靶序列”或“靶核酸”对细胞(例如,真核细胞)而言,可以是任何内源或外源的多核苷酸。例如,靶核酸可以是存在于真核细胞的细胞核中的多核苷酸(例如基因组DNA),也可以是外源导入细胞中的多核苷酸(例如载体DNA)。例如,靶核酸可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如,调节多核苷酸或无用DNA)。在某些情况下,靶核酸或靶序列包含原间隔序列临近基序(PAM)或与之相邻。对PAM的精确序列和长度的要求取决于使用的Cas蛋白。通常,PAM为CRISPR簇中临近原间隔序列的2-5个碱基对的序列。本领域技术人员能够鉴定与给定的Cas蛋白一起使用的PAM序列。
如本文中所使用的,术语“载体”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;纳米脂质体颗粒;外泌体;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。当载体携带拟整合到宿主基因组上的外源DNA以及与外源DNA整合相关的非蛋白表达元件时,载体称为供体载体。外源DNA包括但不限于完整的基因或基因片段,启动子序列、转录起始序列、增强子序列、选择元件及蛋白编码序列。与外源DNA整合相关的非蛋白表达元件包括但不限于拟插入位点的同源序列、工具酶的靶向切割序列等。腺相关病毒载体包括但不限于AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8,AAV9,AAV-DJ等不同血清型的腺相关病毒以及其他改造的血清型的腺相关病毒。
本发明中,所述“内含肽”是指一类可以介导翻译后的蛋白进行剪接的内部蛋白原件。内含肽位于多肽序列的中间,经过加工后切除,并催化两端的蛋白质外显肽连接为成熟的蛋白质分子。所述“内含肽拆分系统”是一种利用内含肽对较大的蛋白质分子进行高效的拆分和拼接的系统。内含肽可以分开为N端段和C端段。将目的蛋白拆分为N端段和C端段两部分,分别与内含肽的N端段和C端段连接,形成融合蛋白。只有当N端部分和C端部分两融合蛋白相遇时,拆分的前体蛋白中的内含肽发生蛋白剪接去除,目的蛋白的N端段和C端段实现拼接,进而形成有功能的目的蛋白。本发明中适用的内含肽来自但不限于Synechocystissp.PCC6803以及Nostoc punctiforme PCC73102(Npu)的DnaE DNA聚合酶。
如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如酵母细胞或曲霉菌等的真菌细胞,如S2果蝇细胞或Sf9等的昆虫细胞,或者如纤维原细胞,CHO细胞,COS细胞,NSO细胞,HeLa细胞,BHK细胞,HEK 293细胞或人细胞等的动物细胞。
在第一方面,本申请提供了一种系统或试剂盒,其包含下述四种组分:
(1)第一Cas蛋白或含有编码所述第一Cas蛋白的核苷酸序列的核酸分子A1,其中,所述第一Cas蛋白能够切割或断裂第一双链靶核酸;
(2)依赖于模板的第一DNA聚合酶或含有编码所述第一DNA聚合酶的核苷酸序列的核酸分子B1;
(3)第一gRNA或含有编码所述第一gRNA的核苷酸序列的核酸分子C1,其中,所述第一gRNA能够与所述第一Cas蛋白结合,并形成第一功能性复合物;所述第一功能性复合物能够将第一双链靶核酸的两条链断裂,形成断裂的靶核酸片段;
(4)第一标签引物或含有编码所述第一标签引物的核苷酸序列的核酸分子D1,其中,所述第一标签引物含有第一标签序列和第一靶结合序列,所述第一标签序列位于所述第一靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述第一标签序列不与所述靶核酸片段结合,处于游离的单链状态。
在某些实施方案中,所述第一Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第一Cas蛋白能够断裂第一双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第一Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第一Cas蛋白具有SEQ ID NO:1示的氨基酸序列。
各种Cas蛋白的序列和结构是本领域技术人员熟知的。目前,已经在多种物种中报道了多种Cas9蛋白及其同源物,包括但不限于酿脓链球菌和嗜热链球菌。基于本发明所公开的内容,其它适合的Cas9蛋白对于本领域技术人员将是显而易见的,例如,Chylinski,Rhun,and Charpentier.The tracrRNA and Cas9 families of type II CRISPR-Casimmunity systems.(2013)RNA Biology 10:5,726-737(其全部内容通过引用并入本文)中公开的Cas9蛋白。
在一些实施方案中,Cas9是来自以下物种的Cas9:溃疡棒状杆菌(NCBI Refs:NC_015683.1,NC_017317.1);白喉棒状杆菌(NCBI Refs:NC_016782.1,NC_016786.1);Spiroplasma syrphidicola(NCBI Ref:NC_021284.1);中间普雷沃菌(NCBI Ref:NC_017861.1);Spiroplasma taiwanense(NCBI Ref:NC_021846.1);海豚链球菌(NCBI Ref:NC_021314.1);Belliella baltica(NCBI Ref:NC_018010.1);Psychrof lexus torq uisI(NCBI Ref:NC_018721.1);嗜热链球菌(NCBI Ref:YP_820832.1);无害利斯特菌(NCBIRef:NP_472073.1);酿脓链球菌(NCBI Ref:NC_017053.1)。
在某些实施方案中,所述第一DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第一DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第一DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第一DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述第一Cas蛋白与所述第一DNA聚合酶相连接。
在某些实施方案中,所述第一Cas蛋白通过接头或者不通过接头与所述第一DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第一Cas蛋白通过肽接头或者不通过肽接头与所述第一DNA聚合酶融合,形成第一融合蛋白。
在某些实施方案中,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的N端;或者,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的C端。
在某些实施方案中,所述第一融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在一些实施方案中,所述接头为肽接头。在一些实施方案中,所述肽接头的长度为5-200个氨基酸,例如5,6,7,8,9,10,15,20,25,30,30-40,40-50,50-60,60-70,70-80,80-90,90-100,100-150或150-200个氨基酸。
在某些实施方案中,所述第一融合蛋白或所述第一cas蛋白可以通过内含肽拆分系统拆分为两个部分。易于理解,所述内含肽拆分系统可以在第一融合蛋白或所述第一cas蛋白的任意氨基酸位置拆分。例如,在某些实施方案中,所述内含肽拆分系统在所述的第一cas蛋白的内部进行拆分。因此,在某些实施方案中,所述第一cas蛋白被拆分为N端段和C端段。例如,所述第一cas蛋白的N端段和C端段可以分别与内含肽的N端段和C端段(或者分别与内含肽的C端段和N端段)融合,并且二者在细胞内能够重构成具有活性的第一cas蛋白。在某些实施方案中,所述第一cas蛋白的N端段和C端段在分离的状态下各自不具有活性,但在细胞内能够重构成具有活性的第一cas蛋白。相应地,在某些实施方案中,所述核酸分子A1可以被拆分为两个部分,其分别包含编码所述第一cas蛋白的N端段和C端段的核苷酸序列。此外,易于理解,在所述第一融合蛋白中,所述第一DNA聚合酶可以融合至所述第一cas蛋白的N端段或C端段。在某些实施方案中,所述第一DNA聚合酶融合至所述第一cas蛋白的C端段。
在某些实施方案中,所述第一gRNA含有第一引导序列,并且,在允许核酸杂交或退火的条件下,所述第一引导序列能够杂交或退火至第一双链靶核酸的一条核酸链。
在某些实施方案中,所述第一引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一gRNA还含有第一支架序列,其能够被所述第一Cas蛋白识别并结合,从而形成第一功能性复合物。
在某些实施方案中,所述第一支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一引导序列位于所述第一支架序列的上游或5’端。
在某些实施方案中,所述第一功能性复合物在所述第一引导序列与第一双链靶核酸结合后,能够将第一双链靶核酸的两条链断裂。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,并且所述3’端是因所述第一功能性复合物断裂所述第一双链靶核酸而形成的。
在某些实施方案中,所述第一靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,在所述第一靶结合序列杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端后,所述第一DNA聚合酶能够以第一标签引物为模板,延伸所述核酸链的3’端。在某些实施方案中,所述延伸形成第一悬突。
在某些实施方案中,所述第一标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第一标签引物为单链核糖核酸,并且所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第一标签引物为单链脱氧核糖核酸,并且所述第一DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述第一引导序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的。在某些实施方案中,所述第一引导序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链。
在某些实施方案中,所述第一标签引物与所述第一gRNA相连接。
在某些实施方案中,所述第一标签引物通过接头或者不通过接头与所述第一gRNA共价相连接。
在某些实施方案中,所述第一标签引物任选地通过接头连接至所述第一gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第一标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第一gRNA的3’端相连接,形成第一PegRNA。
在某些实施方案中,所述核酸分子A1能够在细胞中表达所述第一Cas蛋白。在某些实施方案中,所述核酸分子B1能够在细胞中表达所述第一DNA聚合酶。在某些实施方案中,所述核酸分子C1能够在细胞中转录出所述第一gRNA。在某些实施方案中,所述核酸分子D1能够在细胞中转录出所述第一标签引物。
在某些实施方案中,所述核酸分子A1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A1为含有编码所述第一Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述核酸分子B1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B1为含有编码所述第一DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述核酸分子C1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C1为含有编码所述第一gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述核酸分子D1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D1为含有编码所述第一标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。
在某些实施方案中,所述核酸分子A1、B1、C1和D1中的两个、三个或四个包含于相同的表达载体(例如,真核表达载体)中。
在某些实施方案中,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;和,
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含:
(5)第二gRNA或含有编码所述第二gRNA的核苷酸序列的核酸分子C2,其中,所述第二gRNA能够与第二Cas蛋白结合,并形成第二功能性复合物;所述第二功能性复合物能够将第二双链靶核酸的两条链断裂,形成断裂的靶核酸片段。
在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白相同或者不同。在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白相同。
在某些实施方案中,所述第二gRNA含有第二引导序列,并且,在允许核酸杂交或退火的条件下,所述第二引导序列能够杂交或退火到第二双链靶核酸的一条核酸链。
在某些实施方案中,所述第二功能性复合物在所述第二引导序列与第二双链靶核酸结合后,将第二双链靶核酸的两条链断裂。
在某些实施方案中,所述第二引导序列与所述第一引导序列不同。
在某些实施方案中,所述第二双链靶核酸与所述第一双链靶核酸相同或者不同。
在某些实施方案中,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第二功能性复合物与所述第一功能性复合物在不同的位置断裂所述相同的双链靶核酸。
在某些实施方案中,所述第二功能性复合物与所述第一功能性复合物断裂相同的双链靶核酸,并且,所述第一引导序列结合的核酸链与所述第二引导序列结合的核酸链是不同的;在某些实施方案中,所述第一引导序列结合的核酸链是所述第二引导序列结合的核酸链的相对链。
在某些实施方案中,所述第二引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二gRNA还含有第二支架序列,其能够被所述第二Cas蛋白识别并结合,从而形成第二功能性复合物。
在某些实施方案中,所述第二支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二支架序列与所述第一支架序列相同或者不同;在某些实施方案中,所述第二支架序列与所述第一支架序列相同。
在某些实施方案中,所述第二引导序列位于所述第二支架序列的上游或5’端。
在某些实施方案中,所述核酸分子C2能够在细胞中转录出所述第二gRNA。
在某些实施方案中,所述核酸分子C2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C2为含有编码所述第二gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白不同;并且,所述系统或试剂盒还包含:
(6)所述第二Cas蛋白或含有编码所述第二Cas蛋白的核苷酸序列的核酸分子A2,其中,所述第二Cas蛋白能够切割或断裂第二双链靶核酸。
在某些实施方案中,所述第二Cas蛋白能够断裂第二双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第二Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第二Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第二Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述核酸分子A2能够在细胞中表达所述第二Cas蛋白。
在某些实施方案中,所述核酸分子A2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A2为含有编码所述第二Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述系统或试剂盒还包含:
(7)第二标签引物或含有编码所述第二标签引物的核苷酸序列的核酸分子D2,其中,所述第二标签引物含有第二标签序列和第二靶结合序列,所述第二标签序列位于所述第二靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述第二标签序列不与所述靶核酸片段结合,处于游离的单链状态。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,并且所述3’端是因所述第二功能性复合物断裂第二双链靶核酸而形成的。
在某些实施方案中,所述第二靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二靶结合序列与所述第一靶结合序列不同。在某些实施方案中,所述第二靶结合序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的。在某些实施方案中,所述第二靶结合序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链。
在某些实施方案中,所述第二标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二标签序列与所述第一标签序列相同或不同。在某些实施方案中,所述第二标签序列与所述第一标签序列不同。
在某些实施方案中,在所述第二靶结合序列杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端后,第二DNA聚合酶能够以第二标签引物为模板,延伸所述核酸链的3’端。在某些实施方案中,所述延伸形成第二悬突。
在某些实施方案中,所述第二DNA聚合酶与所述第一DNA聚合酶相同或者不同。在某些实施方案中,所述第二DNA聚合酶与所述第一DNA聚合酶相同。
在某些实施方案中,所述第二标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第二标签引物为单链核糖核酸,并且所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第二标签引物为单链脱氧核糖核酸,并且所述第二DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述第二引导序列结合的核酸链与所述第二靶结合序列结合的核酸链是不同的。在某些实施方案中,所述第二引导序列结合的核酸链是所述第二靶结合序列结合的核酸链的相对链。
在某些实施方案中,所述第二引导序列与所述第一靶结合序列结合相同的核酸链,并且,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的上游或5’端。
在某些实施方案中,所述第一引导序列与所述第二靶结合序列结合相同的核酸链,并且,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的上游或5’端。
在某些实施方案中,所述第一悬突和第二悬突包含于相同的靶核酸片段上,且彼此位于相对的核酸链上。
在某些实施方案中,所述核酸分子D2能够在细胞中转录出所述第二标签引物。
在某些实施方案中,所述核酸分子D2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D2为含有编码所述第二标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第二DNA聚合酶与所述第一DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(8)所述第二DNA聚合酶或含有编码所述第二DNA聚合酶的核苷酸序列的核酸分子B2。
在某些实施方案中,所述第二DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第二DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第二DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第二DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述核酸分子B2能够在细胞中表达所述第二DNA聚合酶。
在某些实施方案中,所述核酸分子B2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B2为含有编码所述第二DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,其中,所述第二标签引物与所述第二gRNA相连接。
在某些实施方案中,所述第二标签引物通过接头或者不通过接头与所述第二gRNA共价相连接。
在某些实施方案中,所述第二标签引物任选地通过接头连接至所述第二gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第二标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第二gRNA的3’端相连接,形成第二PegRNA。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。
在某些实施方案中,所述系统或试剂盒包含:含有所述第二gRNA和所述第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述第二Cas蛋白与所述第二DNA聚合酶是分离的或者相连接的。
在某些实施方案中,所述第二Cas蛋白通过接头或者不通过接头与所述第二DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第二Cas蛋白通过肽接头或者不通过肽接头与所述第二DNA聚合酶融合,形成第二融合蛋白。
在某些实施方案中,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的N端;或者,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的C端。
在某些实施方案中,所述第二融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在某些实施方案中,所述第二融合蛋白或所述第二cas蛋白可以通过内含肽拆分系统拆分为两个部分。易于理解,所述内含肽拆分系统可以在第二融合蛋白或所述第二cas蛋白的任意氨基酸位置拆分。例如,在某些实施方案中,所述内含肽拆分系统在所述的第二cas蛋白的内部进行拆分。因此,在某些实施方案中,所述第二cas蛋白被拆分为N端段和C端段。例如,所述第二cas蛋白的N端段和C端段可以分别与内含肽的N端段和C端段(或者分别与内含肽的C端段和N端段)融合,并且二者在细胞内能够重构成具有活性的第二cas蛋白。在某些实施方案中,所述第二cas蛋白的N端段和C端段在分离的状态下各自不具有活性,但在细胞内能够重构成具有活性的第二cas蛋白。相应地,在某些实施方案中,所述核酸分子A1可以被拆分为两个部分,其分别包含编码所述第二cas蛋白的N端段和C端段的核苷酸序列。此外,易于理解,在所述第二融合蛋白中,所述第二DNA聚合酶可以融合至所述第二cas蛋白的N端段或C端段。在某些实施方案中,所述第二DNA聚合酶融合至所述第二cas蛋白的C端段。
在某些实施方案中,所述核酸分子A2和核酸分子B2包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A2和核酸分子B2在细胞中能够表达分离的所述第二Cas蛋白和所述第二DNA聚合酶,或者能够表达含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白。
在某些实施方案中,所述系统或试剂盒包含,含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白,或者,含有编码所述第二融合蛋白的核苷酸序列的核酸分子。或者,分离的所述第二Cas蛋白和第二DNA聚合酶,或者,能够表达分离的所述第二Cas蛋白和第二DNA聚合酶的核酸分子。
在某些实施方案中,所述第一和第二Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含核酸载体。
在某些实施方案中,所述核酸载体是双链的。
在某些实施方案中,所述核酸载体是环状双链载体。
在某些实施方案中,所述核酸载体包含能够与所述第一引导序列杂交或退火的第一引导结合序列(例如,所述第一引导序列的互补序列),和/或,能够与所述第二引导序列杂交或退火的第二引导结合序列(例如,所述第二引导序列的互补序列)。在某些实施方案中,所述核酸载体在所述第一引导结合序列与所述第二引导结合序列之间还包含限制性酶切位点。
在某些实施方案中,所述第一引导结合序列与所述第二引导结合序列位于所述核酸载体的相对链上。
在某些实施方案中,所述核酸载体还包含所述第一Cas蛋白识别的第一PAM序列,和/或,所述第二Cas蛋白识别的第二PAM序列。
在某些实施方案中,所述第一功能性复合物能够通过所述第一引导结合序列和所述第一PAM序列,结合并断裂所述核酸载体;和/或,所述第二功能性复合物能够通过所述第二引导结合序列和所述第二PAM序列,结合并断裂所述核酸载体。
在某些实施方案中,所述核酸载体还包含目的基因。
在某些实施方案中,所述目的基因位于所述第一引导结合序列与所述第二引导结合序列之间。
在某些实施方案中,所述第一功能性复合物和所述第二功能性复合物断裂所述核酸载体,导致产生含有目的基因的核酸片段。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第一标签引物能够通过所述第一靶结合序列与所述核酸片段的一条核酸链的3’端杂交或退火,形成双链结构,并且,所述第一标签引物的所述第一标签序列处于游离状态;在某些实施方案中,所述第一靶结合序列杂交或退火的核酸链是含有所述第一引导结合序列的核酸链的相对链。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第二标签引物能够通过所述第二靶结合序列与所述核酸片段的一条核酸链的3’端杂交或退火,形成双链结构,并且,所述第二标签引物的所述第二标签序列处于游离状态;在某些实施方案中,所述第二靶结合序列杂交或退火的核酸链是含有所述第二引导结合序列的核酸链的相对链。
在某些实施方案中,所述第一靶结合序列杂交或退火的核酸链是所述第二靶结合序列杂交或退火的核酸链的相对链。
在某些实施方案中,所述核酸载体还包含第一靶序列;其中,在允许核酸杂交或退火的条件下,所述第一标签引物能够通过所述第一靶结合序列与所述第一靶序列杂交或退火,形成双链结构,并且,所述第一标签引物的所述第一标签序列处于游离状态。在某些实施方案中,所述第一靶序列位于所述第一引导结合序列与所述第二引导结合序列之间。在某些实施方案中,所述第一靶序列位于所述第一引导结合序列的相对链。在某些实施方案中,在所述第一功能性复合物断裂所述核酸载体后,含有第一靶序列的核酸链能够以退火至第一靶序列的第一标签引物为模板进行延伸(在某些实施方案中,形成第一悬突)。在某些实施方案中,所述第一功能性复合物断裂所述核酸载体的位点位于所述第一靶序列的3’末端或者3’部分。在某些实施方案中,所述第一靶序列位于所述含有目的基因的核酸片段的一条核酸链的3’末端。
和/或,
所述核酸载体还包含第二靶序列;其中,在允许核酸杂交或退火的条件下,所述第二标签引物能够通过所述第二靶结合序列与所述第二靶序列杂交或退火,形成双链结构,并且,所述第二标签引物的所述第二标签序列处于游离状态;在某些实施方案中,所述第二靶序列位于所述第一引导结合序列与所述第二引导结合序列之间。在某些实施方案中,所述第二靶序列位于所述第二引导结合序列的相对链。在某些实施方案中,在所述第二功能性复合物断裂所述核酸载体后,含有第二靶序列的核酸链能够以退火至第二靶序列的第二标签引物为模板进行延伸(在某些实施方案中,形成第二悬突)。在某些实施方案中,所述第二功能性复合物断裂所述核酸载体的位点位于所述第二靶序列的3’末端或者3’部分;在某些实施方案中,所述第二靶序列位于所述含有目的基因的核酸片段的一条核酸链的3’末端。
在某些实施方案中,含有第一靶序列的核酸链位于含有第二靶序列的核酸链的相对链。
在某些实施方案中,所述核酸载体在所述第一靶序列与所述第二靶序列之间还包含限制性酶切位点。
在某些实施方案中,所述核酸载体在所述第一靶序列与所述第二靶序列之间还包含目的基因。
在某些实施方案中,所述系统或试剂盒还包含:
(9)第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子C3,其中,所述第三gRNA能够与第三Cas蛋白结合,并形成第三功能性复合物;所述第三功能性复合物能够将第三双链靶核酸的两条链断裂,形成断裂的核苷酸片段a1和a2。
在某些实施方案中,所述第三Cas蛋白与所述第一Cas蛋白或第二Cas蛋白相同或者不同;在某些实施方案中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白。
在某些实施方案中,所述第三gRNA含有第三引导序列,并且,在允许核酸杂交或退火的条件下,所述第三引导序列能够杂交或退火到第三双链靶核酸的一条核酸链。
在某些实施方案中,所述第三功能性复合物在所述第三引导序列与第三双链靶核酸结合后,将第三双链靶核酸的两条链断裂。
在某些实施方案中,所述第三引导序列与所述第一引导序列或第二引导序列相同或者不同。在某些实施方案中,所述第一、第二和第三引导序列彼此不同。
在某些实施方案中,所述第三双链靶核酸与所述第一双链靶核酸或第二双链靶核酸相同或者不同。在某些实施方案中,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第三双链靶核酸与所述第一和第二双链靶核酸是不同的。在某些实施方案中,所述第三双链靶核酸为基因组DNA。
在某些实施方案中,所述第三引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第三gRNA还含有第三支架序列,其能够被所述第三Cas蛋白识别并结合,从而形成第三功能性复合物。
在某些实施方案中,所述第三支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第三支架序列与所述第一支架序列或第二支架序列相同或者不同。在某些实施方案中,所述第一、第二和第三支架序列是相同的。
在某些实施方案中,所述第三引导序列位于所述第三支架序列的上游或5’端。
在某些实施方案中,所述核酸分子C3能够在细胞中转录出所述第三gRNA。
在某些实施方案中,所述核酸分子C3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C3为含有编码所述第三gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第三功能性复合物能够将第三双链靶核酸的两条链断裂,形成断裂的核苷酸片段a1和a2。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火。在某些实施方案中,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火。在某些实施方案中,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的。
在某些实施方案中,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’部分,且所述核苷酸片段a1的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第一间隔区域。
在某些实施方案中,所述第一间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a2杂交或退火。在某些实施方案中,所述第二标签序列或其互补序列或所述第二悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a2杂交或退火。在某些实施方案中,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的。
在某些实施方案中,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’部分,且所述核苷酸片段a2的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第二间隔区域。
在某些实施方案中,所述第二间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt。
在某些实施方案中,所述第三Cas蛋白与所述第一Cas蛋白或第二Cas蛋白不同;并且,所述系统或试剂盒还包含:
(10)所述第三Cas蛋白或含有编码所述第三Cas蛋白的核苷酸序列的核酸分子A3,其中,所述第三Cas蛋白能够切割或断裂第三双链靶核酸。
在某些实施方案中,所述第三Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第三Cas蛋白能够断裂第三双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第三Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第三Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述核酸分子A3能够在细胞中表达所述第三Cas蛋白。
在某些实施方案中,所述核酸分子A3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A3为含有编码所述第三Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)所述第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含:如前述中所定义的核酸载体。
在某些实施方案中,所述系统或试剂盒还包含:
(11)第三标签引物或含有编码所述第三标签引物的核苷酸序列的核酸分子D3,其中,所述第三标签引物含有第三标签序列和第三靶结合序列,所述第三标签序列位于所述第三靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第三靶结合序列能够杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端,形成双链结构,且,所述第三标签序列不与所述核苷酸片段a1或a2结合,处于游离的单链状态。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第三靶结合序列能够杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端,并且所述3’端是因所述第三功能性复合物断裂第三双链靶核酸而形成的。
在某些实施方案中,所述第三靶结合序列结合的核酸链与所述第三引导序列结合的核酸链是不同的;在某些实施方案中,所述第三靶结合序列结合的核酸链是所述第三引导序列结合的核酸链的相对链。
在某些实施方案中,所述第三靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第三靶结合序列与所述第一或第二靶结合序列不同。
在某些实施方案中,在所述第三靶结合序列杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端后,第三DNA聚合酶能够以第三标签引物为模板,延伸所述核酸链的3’端;在某些实施方案中,所述延伸形成第三悬突。
在某些实施方案中,所述第三标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第三标签序列与所述第一或第二标签序列相同或不同。在某些实施方案中,所述第三标签序列与所述第一或第二标签序列不同。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与含有第一悬突或者第二悬突的核酸链杂交或退火;在某些实施方案中,所述第三标签序列的互补序列或所述第三悬突与所述第一悬突或者第二悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,所述第三DNA聚合酶与所述第一或第二DNA聚合酶相同或者不同;在某些实施方案中,所述第一、第二和第三DNA聚合酶是相同的DNA聚合酶。
在某些实施方案中,所述第三标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第三标签引物为单链核糖核酸,并且所述第三DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第三标签引物为单链脱氧核糖核酸,并且所述第三DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述核酸分子D3能够在细胞中转录出所述第三标签引物。
在某些实施方案中,所述核酸分子D3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D3为含有编码所述第三标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第三DNA聚合酶与所述第一或第二DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(12)所述第三DNA聚合酶或含有编码所述第三DNA聚合酶的核苷酸序列的核酸分子B3。
在某些实施方案中,所述第三DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第三DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第三DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第三DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述核酸分子B3能够在细胞中表达所述第三DNA聚合酶。
在某些实施方案中,所述核酸分子B3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B3为含有编码所述第三DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第三标签引物与所述第三gRNA相连接。
在某些实施方案中,所述第三标签引物通过接头或者不通过接头与所述第三gRNA共价相连接。
在某些实施方案中,所述第三标签引物任选地通过接头连接至所述第三gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第三标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第三gRNA的3’端相连接,形成第三PegRNA。
在某些实施方案中,所述核酸分子C3和核酸分子D3包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C3和核酸分子D3在细胞中能够转录出含有所述第三gRNA和所述第三标签引物的第三PegRNA。
在某些实施方案中,所述系统或试剂盒包含:含有所述第三gRNA和所述第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述第三Cas蛋白与所述第三DNA聚合酶是分离的或者相连接的。
在某些实施方案中,所述第三Cas蛋白通过接头或者不通过接头与所述第三DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第三Cas蛋白通过肽接头或者不通过肽接头与所述第三DNA聚合酶融合,形成第三融合蛋白。
在某些实施方案中,所述第三Cas蛋白任选地通过接头连接或融合至所述第三DNA聚合酶的N端;或者,所述第三Cas蛋白任选地通过接头连接或融合至所述第三DNA聚合酶的C端。
在某些实施方案中,所述第三融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在某些实施方案中,所述第三融合蛋白或所述第三cas蛋白可以通过内含肽拆分系统拆分为两个部分。易于理解,所述内含肽拆分系统可以在第三融合蛋白或所述第三cas蛋白的任意氨基酸位置拆分。例如,在某些实施方案中,所述内含肽拆分系统在所述的第三cas蛋白的内部进行拆分。因此,在某些实施方案中,所述第三cas蛋白被拆分为N端段和C端段。例如,所述第三cas蛋白的N端段和C端段可以分别与内含肽的N端段和C端段(或者分别与内含肽的C端段和N端段)融合,并且二者在细胞内能够重构成具有活性的第三cas蛋白。在某些实施方案中,所述第三cas蛋白的N端段和C端段在分离的状态下各自不具有活性,但在细胞内能够重构成具有活性的第三cas蛋白。相应地,在某些实施方案中,所述核酸分子A1可以被拆分为两个部分,其分别包含编码所述第三cas蛋白的N端段和C端段的核苷酸序列。此外,易于理解,在所述第三融合蛋白中,所述第三DNA聚合酶可以融合至所述第三cas蛋白的N端段或C端段。在某些实施方案中,所述第三DNA聚合酶融合至所述第三cas蛋白的C端段。
在某些实施方案中,所述核酸分子A3和核酸分子B3包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A3和核酸分子B3在细胞中能够表达分离的所述第三Cas蛋白和所述第三DNA聚合酶,或者能够表达含有所述第三Cas蛋白和所述第三DNA聚合酶的第三融合蛋白。
在某些实施方案中,所述系统或试剂盒包含,含有所述第三Cas蛋白和所述第三DNA聚合酶的第三融合蛋白,或者,含有编码所述第三融合蛋白的核苷酸序列的核酸分子。或者,分离的所述第三Cas蛋白和第三DNA聚合酶,或者,能够表达分离的所述第三Cas蛋白和第三DNA聚合酶的核酸分子。
在某些实施方案中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,所述第一、第二和第三DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)含有所述第三gRNA和第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含:如前述中所定义的核酸载体。
在某些实施方案中,所述系统或试剂盒还包含:
(13)第四gRNA或含有编码所述第四gRNA的核苷酸序列的核酸分子C4,其中,所述第四gRNA能够与第四Cas蛋白结合,并形成第四功能性复合物;所述第四功能性复合物能够将第四双链靶核酸的两条链断裂,形成断裂的靶核酸片段b1和b2。
在某些实施方案中,所述第四Cas蛋白与所述第一、第二或第三Cas蛋白相同或者不同;在某些实施方案中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白。
在某些实施方案中,所述第四gRNA含有第四引导序列,并且,在允许核酸杂交或退火的条件下,所述第四引导序列能够杂交或退火到第四双链靶核酸的一条核酸链。
在某些实施方案中,所述第四功能性复合物在所述第四引导序列与第四双链靶核酸结合后,将第四双链靶核酸的两条链断裂。
在某些实施方案中,所述第四引导序列与所述第一、第二或第三引导序列相同或者不同。在某些实施方案中,所述第一、第二、第三和第四引导序列彼此不同。
在某些实施方案中,所述第四双链靶核酸与所述第一、第二或第三双链靶核酸相同或者不同。在某些实施方案中,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第四双链靶核酸与所述第三双链靶核酸是相同的,但与第一或第二双链靶核酸不同。在某些实施方案中,所述第四功能性复合物与所述第三功能性复合物在不同的位置断裂所述相同的双链靶核酸。
在某些实施方案中,所述第四功能性复合物与所述第三功能性复合物断裂相同的双链靶核酸,并且,所述第四引导序列结合的核酸链与所述第三引导序列结合的核酸链是不同的。在某些实施方案中,所述第四引导序列结合的核酸链是所述第三引导序列结合的核酸链的相对链。
在某些实施方案中,所述第四双链靶核酸为基因组DNA。
在某些实施方案中,所述第四引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第四gRNA还含有第四支架序列,其能够被所述第四Cas蛋白识别并结合,从而形成第四功能性复合物。
在某些实施方案中,所述第四支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第四支架序列与所述第一、第二或第三支架序列相同或者不同。在某些实施方案中,所述第一、第二、第三和第四支架序列是相同的。
在某些实施方案中,所述第四引导序列位于所述第四支架序列的上游或5’端。
在某些实施方案中,所述核酸分子C4能够在细胞中转录出所述第四gRNA。
在某些实施方案中,所述核酸分子C4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C4为含有编码所述第四gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第四双链靶核酸与所述第三双链靶核酸是相同的,并且,所述第三和第四功能性复合物在不同的位置断裂所述相同的双链靶核酸,形成断裂的核苷酸片段a1、a2和a3;其中,在断裂之前,在所述相同的双链靶核酸中,核苷酸片段a1、a2和a3依次排列(即,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连);在某些实施方案中,所述第三和第四功能性复合物分别导致核苷酸片段a1和a2的分离以及核苷酸片段a2和a3的分离。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火;在某些实施方案中,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火。在某些实施方案中,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a3杂交或退火。在某些实施方案中,所述第二标签序列或其互补序列或所述第二悬突能够在第四功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a3杂交或退火。在某些实施方案中,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述第三双链靶核酸而形成的。
在某些实施方案中,所述第四Cas蛋白与所述第一、第二或第三Cas蛋白不同;并且,所述系统或试剂盒还包含:
(14)所述第四Cas蛋白或含有编码所述第四Cas蛋白的核苷酸序列的核酸分子A4,其中,所述第四Cas蛋白能够切割或断裂第四双链靶核酸。
在某些实施方案中,所述第四Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第四Cas蛋白能够断裂第四双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第四Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第四Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述核酸分子A4能够在细胞中表达所述第四Cas蛋白。
在某些实施方案中,所述核酸分子A4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A4为含有编码所述第四Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶(以及任选的第三DNA聚合酶)是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)所述第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子;或者,含有所述第三gRNA和第三标签引物的第三PegRNA,或,含有编码所述第三PegRNA的核苷酸序列的核酸分子;
(M5)所述第四gRNA或含有编码所述第四gRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含:如前述中所定义的核酸载体。
在某些实施方案中,所述系统或试剂盒还包含:
(15)第四标签引物或含有编码所述第四标签引物的核苷酸序列的核酸分子D4,其中,所述第四标签引物含有第四标签序列和第四靶结合序列,所述第四标签序列位于所述第四靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第四靶结合序列能够杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端,形成双链结构,且,所述第四标签序列不与所述靶核酸片段b1或b2结合,处于游离的单链状态。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第四靶结合序列能够杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端,并且所述3’端是因所述第四功能性复合物断裂第四双链靶核酸而形成的。
在某些实施方案中,所述第四靶结合序列结合的核酸链与所述第四引导序列结合的核酸链是不同的。在某些实施方案中,所述第四靶结合序列结合的核酸链是所述第四引导序列结合的核酸链的相对链。
在某些实施方案中,所述第四靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第四靶结合序列与所述第一、第二或第三靶结合序列不同。在某些实施方案中,所述第四靶结合序列结合的核酸链与所述第三靶结合序列结合的核酸链是不同的。在某些实施方案中,所述第四靶结合序列结合的核酸链是所述第三靶结合序列结合的核酸链的相对链。
在某些实施方案中,在所述第四靶结合序列杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端后,第四DNA聚合酶能够以第四标签引物为模板,延伸所述核酸链的3’端。在某些实施方案中,所述延伸形成第四悬突。
在某些实施方案中,所述第四标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第四标签序列与所述第一、第二或第三标签序列相同或不同。在某些实施方案中,所述第四标签序列与所述第一、第二或第三标签序列不同。
在某些实施方案中,所述第四DNA聚合酶与所述第一、第二或第三DNA聚合酶相同或者不同。在某些实施方案中,所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶。
在某些实施方案中,所述第四标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第四标签引物为单链核糖核酸,并且所述第四DNA聚合酶为依赖于RNA的DNA聚合酶。或者,所述第四标签引物为单链脱氧核糖核酸,并且所述第四DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述第四引导序列与所述第三靶结合序列结合相同的核酸链,并且,所述第三靶结合序列的结合位置位于所述第四引导序列的结合位置的上游或5’端。
在某些实施方案中,所述第三引导序列与所述第四靶结合序列结合相同的核酸链,并且,所述第四靶结合序列的结合位置位于所述第三引导序列的结合位置的上游或5’端。
在某些实施方案中,所述第三悬突和第四悬突包含于不同的靶核酸片段上,且在某些实施方案中,彼此位于相对的核酸链上。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第四标签序列的互补序列或所述第四悬突能够与含有第一悬突或者第二悬突的核酸链杂交或退火。在某些实施方案中,所述第四标签序列的互补序列或所述第四悬突能够与所述第一悬突或者第二悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火,并且,所述第四标签序列的互补序列或所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火;或者,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火,并且,所述第四标签序列的互补序列或所述第四悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,所述核酸分子D4能够在细胞中转录出所述第四标签引物。
在某些实施方案中,所述核酸分子D4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D4为含有编码所述第四标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第四DNA聚合酶与所述第一、第二或第三DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(16)所述第四DNA聚合酶或含有编码所述第四DNA聚合酶的核苷酸序列的核酸分子B4。
在某些实施方案中,所述第四DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第四DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第四DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第四DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述核酸分子B4能够在细胞中表达所述第四DNA聚合酶;
在某些实施方案中,所述核酸分子B4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B4为含有编码所述第四DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
在某些实施方案中,所述第四标签引物与所述第四gRNA相连接。
在某些实施方案中,所述第四标签引物通过接头或者不通过接头与所述第四gRNA共价相连接。
在某些实施方案中,所述第四标签引物任选地通过接头连接至所述第四gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第四标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第四gRNA的3’端相连接,形成第四PegRNA。
在某些实施方案中,所述核酸分子C4和核酸分子D4包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C4和核酸分子D4在细胞中能够转录出含有所述第四gRNA和所述第四标签引物的第四PegRNA。
在某些实施方案中,所述系统或试剂盒包含:含有所述第四gRNA和所述第四标签引物的第四PegRNA,或者,含有编码所述第四PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述第四Cas蛋白与所述第四DNA聚合酶分离的或者相连接的。
在某些实施方案中,所述第四Cas蛋白通过接头或者不通过接头与所述第四DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第四Cas蛋白通过肽接头或者不通过肽接头与所述第四DNA聚合酶融合,形成第四融合蛋白。
在某些实施方案中,所述第四Cas蛋白任选地通过接头连接或融合至所述第四DNA聚合酶的N端;或者,所述第四Cas蛋白任选地通过接头连接或融合至所述第四DNA聚合酶的C端。
在某些实施方案中,所述第四融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在某些实施方案中,所述第四融合蛋白或所述第四cas蛋白可以通过内含肽拆分系统拆分为两个部分。易于理解,所述内含肽拆分系统可以在第四融合蛋白或所述第四cas蛋白的任意氨基酸位置拆分。例如,在某些实施方案中,所述内含肽拆分系统在所述的第四cas蛋白的内部进行拆分。因此,在某些实施方案中,所述第四cas蛋白被拆分为N端段和C端段。例如,所述第四cas蛋白的N端段和C端段可以分别与内含肽的N端段和C端段(或者分别与内含肽的C端段和N端段)融合,并且二者在细胞内能够重构成具有活性的第四cas蛋白。在某些实施方案中,所述第四cas蛋白的N端段和C端段在分离的状态下各自不具有活性,但在细胞内能够重构成具有活性的第四cas蛋白。相应地,在某些实施方案中,所述核酸分子A1可以被拆分为两个部分,其分别包含编码所述第四cas蛋白的N端段和C端段的核苷酸序列。此外,易于理解,在所述第四融合蛋白中,所述第四DNA聚合酶可以融合至所述第四cas蛋白的N端段或C端段。在某些实施方案中,所述第四DNA聚合酶融合至所述第四cas蛋白的C端段。
在某些实施方案中,所述核酸分子A4和核酸分子B4包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A4和核酸分子B4在细胞中能够表达分离的所述第四Cas蛋白和所述第四DNA聚合酶,或者能够表达含有所述第四Cas蛋白和所述第四DNA聚合酶的第四融合蛋白。
在某些实施方案中,所述系统或试剂盒包含,含有所述第四Cas蛋白和所述第四DNA聚合酶的第四融合蛋白,或者,含有编码所述第四融合蛋白的核苷酸序列的核酸分子。或者,分离的所述第四Cas蛋白和第四DNA聚合酶,或者,能够表达分离的所述第四Cas蛋白和第四DNA聚合酶的核酸分子。
在某些实施方案中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)含有所述第三gRNA和第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子;
(M5)含有所述第四gRNA和第四标签引物的第四PegRNA,或者,含有编码所述第四PegRNA的核苷酸序列的核酸分子。
在某些实施方案中,所述系统或试剂盒还包含:如前述中所定义的核酸载体。
在某些实施方案中,所述第四双链靶核酸与所述第三双链靶核酸是相同的,并且,所述第三和第四功能性复合物在不同的位置断裂所述相同的双链靶核酸,形成断裂的核苷酸片段a1、a2和a3。其中,在所述相同的双链靶核酸中,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连。
在某些实施方案中,所述第三和第四功能性复合物分别导致核苷酸片段a1和a2的分离以及核苷酸片段a2和a3的分离。
在某些实施方案中,所述核苷酸片段a1具有以第三标签引物为模板延伸形成的第三悬突;并且,所述核苷酸片段a3具有以第四标签引物为模板延伸形成的第四悬突。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火。在某些实施方案中,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火。在某些实施方案中,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的。在某些实施方案中,所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的第三悬突或其上游核苷酸序列。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a3杂交或退火。在某些实施方案中,所述第二标签序列或其互补序列或所述第二悬突能够在第四功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a3杂交或退火。在某些实施方案中,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述第三双链靶核酸而形成的。在某些实施方案中,所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的第四悬突或其上游核苷酸序列。
在某些实施方案中,在允许核酸杂交或退火的条件下,所述第四标签序列的互补序列或所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,所述试剂盒还包含额外的组分。
在某些实施方案中,所述额外的组分包括选自下列的一项或多项:
(1)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的gRNA或含有编码所述额外的gRNA的核苷酸序列的核酸分子,其中,所述额外的gRNA能够与Cas蛋白结合,并形成功能性复合物。在某些实施方案中,所述功能性复合物能够将双链靶核酸的两条链断裂,形成断裂的靶核酸片段。
(2)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的Cas蛋白或含有编码所述额外的Cas蛋白的核苷酸序列的核酸分子。在某些实施方案中,所述Cas蛋白能够切割或断裂双链靶核酸。
(3)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的标签引物或含有编码所述额外的标签引物的核苷酸序列的核酸分子,其中,所述额外的标签引物含有标签序列和靶结合序列,所述标签序列位于所述靶结合序列的上游或5’端。在某些实施方案中,在允许核酸杂交或退火的条件下,所述靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述标签序列不与所述靶核酸片段结合,处于游离的单链状态。
(4)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的DNA聚合酶或含有编码所述额外的DNA聚合酶的核苷酸序列的核酸分子。在某些实施方案中,所述额外的DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。在某些实施方案中,所述额外的DNA聚合酶为依赖于RNA的DNA聚合酶,例如逆转录酶。
在第二方面,本申请提供了一种融合蛋白,其包含Cas蛋白与依赖于模板的DNA聚合酶,其中,所述Cas蛋白能够断裂双链靶核酸。
在某些实施方案中,所述Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述Cas蛋白通过接头或者不通过接头与所述DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述Cas蛋白任选地通过接头连接或融合至所述DNA聚合酶的N端;或者,所述Cas蛋白任选地通过接头连接或融合至所述DNA聚合酶的C端。
在某些实施方案中,所述融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在第三方面,本申请提供了一种核酸分子,其包含编码如前所述的融合蛋白的多核苷酸。
在第四方面,本申请提供了一种载体,其包含如前所述的核酸分子。
在某些实施方案中,所述载体为表达载体。
在某些实施方案中,所述载体为真核表达载体。
在第五方面,本申请提供了一种宿主细胞,其包含如前所述的核酸分子或如前所述的载体。
在某些实施方案中,所述宿主细胞为原核细胞,例如大肠杆菌细胞;或者所述宿主细胞为真核细胞,例如,酵母细胞,真菌细胞,植物细胞,动物细胞。
在某些实施方案中,所述宿主细胞为哺乳动物细胞,例如人细胞。
在第五方面,本申请提供了一种制备如前所述的融合蛋白的方法,其包括,(1)在允许蛋白表达的条件下,培养如前所述的宿主细胞;和(2)分离所述宿主细胞表达的融合蛋白。
在第六方面,本申请提供了一种复合物,其包含第一Cas蛋白与依赖于模板的第一DNA聚合酶,其中,所述第一Cas蛋白具有断裂双链靶核酸的能力,并且,所述第一Cas蛋白通过共价或者非共价的方式与第一DNA聚合酶复合。
在某些实施方案中,所述第一Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第一Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第一Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第一Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述第一DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第一DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第一DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第一DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述第一Cas蛋白通过接头或者不通过接头与所述第一DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第一Cas蛋白通过肽接头或者不通过肽接头与所述第一DNA聚合酶融合,形成融第一合蛋白。
在某些实施方案中,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的N端;或者,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的C端。
在某些实施方案中,所述第一融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在某些实施方案中,所述复合物还包含第一gRNA。
在某些实施方案中,所述第一gRNA能够与所述第一Cas蛋白结合,并形成第一功能性单元;所述第一功能性单元能够结合双链靶核酸,并将其两条链断裂,形成断裂的靶核酸片段。
在某些实施方案中,所述第一gRNA含有第一引导序列,并且,在允许核酸杂交或退火的条件下,所述第一引导序列能够杂交或退火至双链靶核酸的一条核酸链。
在某些实施方案中,所述第一引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一gRNA还含有第一支架序列,其能够被所述第一Cas蛋白识别并结合,从而形成第一功能性单元。
在某些实施方案中,所述第一支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一引导序列位于所述第一支架序列的上游或5’端。
在某些实施方案中,所述复合物或第一功能性单元在所述第一引导序列与双链靶核酸结合后,能够将双链靶核酸的两条链断裂,形成断裂的靶核酸片段。
在某些实施方案中,所述复合物还包含双链靶核酸,
在某些实施方案中,所述双链靶核酸含有所述第一Cas蛋白识别的第一PAM序列以及能够与所述第一引导序列杂交或退火的第一引导结合序列,由此,所述第一功能性单元通过所述第一引导结合序列和所述第一PAM序列,结合所述双链靶核酸。
在某些实施方案中,所述复合物还包含与所述双链靶核酸杂交或退火的第一标签引物;其中,所述第一标签引物含有第一靶结合序列,其能够与所述双链靶核酸杂交或退火。
在某些实施方案中,所述标签引物含有第一标签序列和第一靶结合序列,所述第一标签序列位于所述第一靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述双链靶核酸。在某些实施方案中,所述第一靶结合序列能够杂交或退火至所述双链靶核酸被所述第一功能性单元断裂的位置处;在某些实施方案中,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构。在某些实施方案中,所述3’端是因所述第一功能性单元断裂所述双链靶核酸而形成的;在某些实施方案中,所述第一标签序列不与所述靶核酸片段结合,处于游离的单链状态。
在某些实施方案中,所述第一靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第一标签引物通过所述第一靶结合序列结合至所述断裂的靶核酸片段;在某些实施方案中,所述第一DNA聚合酶与所述断裂的靶核酸片段和所述第一标签引物结合。
在某些实施方案中,所述第一标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第一标签引物为单链核糖核酸,并且所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第一标签引物为单链脱氧核糖核酸,并且所述第一DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述断裂的靶核酸片段被所述第一DNA聚合酶以所述第一标签引物为模板延伸,形成第一悬突。
在某些实施方案中,所述第一gRNA结合的核酸链与所述第一标签引物结合的核酸链是不同的。在某些实施方案中,所述第一gRNA结合的核酸链是所述第一标签引物结合的核酸链的相对链。
在某些实施方案中,所述第一标签引物与所述第一gRNA相连接。
在某些实施方案中,所述第一标签引物通过接头或者不通过接头与所述第一gRNA共价相连接。
在某些实施方案中,所述第一标签引物任选地通过接头连接至所述第一gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第一标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第一gRNA的3’端相连接,形成第一PegRNA。
在某些实施方案中,所述复合物还包含第二Cas蛋白和第二gRNA,其中,所述第二Cas蛋白具有断裂双链靶核酸的能力,所述第二gRNA能够与所述第二Cas蛋白结合,并形成第二功能性单元;所述第二功能性单元能够结合双链靶核酸,并将其两条链断裂,形成断裂的靶核酸片段。
在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白相同或者不同。在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白相同。
在某些实施方案中,所述第二Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端。
在某些实施方案中,所述第二Cas蛋白选自但不限于Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式。
在某些实施方案中,所述第二Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9)。
在某些实施方案中,所述第二Cas蛋白具有SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述第二gRNA含有第二引导序列,并且,在允许核酸杂交或退火的条件下,所述第二引导序列能够杂交或退火至双链靶核酸的一条核酸链。
在某些实施方案中,所述第二引导序列与所述第一引导序列不同;在某些实施方案中,所述第一引导序列结合的核酸链与所述第二引导序列结合的核酸链是不同的。在某些实施方案中,所述第一引导序列结合的核酸链是所述第二引导序列结合的核酸链的相对链。
在某些实施方案中,所述第二引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二gRNA还含有第二支架序列,其能够被所述第二Cas蛋白识别并结合,从而形成第二功能性单元。
在某些实施方案中,所述第二支架序列与所述第一支架序列相同或者不同。在某些实施方案中,所述第二支架序列与所述第一支架序列相同。
在某些实施方案中,所述第二支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二引导序列位于所述第二支架序列的上游或5’端。
在某些实施方案中,所述双链靶核酸含有所述第二Cas蛋白识别的第二PAM序列以及能够与所述第二引导序列杂交或退火的第二引导结合序列,由此,所述第二功能性单元通过所述第二引导结合序列和所述第二PAM序列,结合所述双链靶核酸。
在某些实施方案中,所述复合物还包含依赖于模板的第二DNA聚合酶,所述第二DNA聚合酶通过共价或者非共价的方式与第二Cas蛋白复合。
在某些实施方案中,所述第二DNA聚合酶选自但不限于依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第二DNA聚合酶为依赖于RNA的DNA聚合酶。
在某些实施方案中,所述第二DNA聚合酶为逆转录酶,例如上文列举的逆转录酶,例如莫洛尼氏鼠白血病病毒的逆转录酶。
在某些实施方案中,所述第二DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
在某些实施方案中,所述第二DNA聚合酶与所述第一DNA聚合酶相同或者不同。在某些实施方案中,所述第二DNA聚合酶与所述第一DNA聚合酶相同。
在某些实施方案中,所述第二Cas蛋白通过接头或者不通过接头与所述第二DNA聚合酶共价相连接。
在某些实施方案中,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQID NO:51所示的氨基酸序列。
在某些实施方案中,所述第二Cas蛋白通过肽接头或者不通过肽接头与所述第二DNA聚合酶融合,形成融第二合蛋白。
在某些实施方案中,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的N端;或者,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的C端。
在某些实施方案中,所述第二融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
在某些实施方案中,所述复合物还包含与所述双链靶核酸杂交或退火的第二标签引物;其中,所述第二标签引物含有第二靶结合序列,其能够与所述双链靶核酸杂交或退火。
在某些实施方案中,所述标签引物含有第二标签序列和第二靶结合序列,所述第二标签序列位于所述第二靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火至所述双链靶核酸。在某些实施方案中,所述第二靶结合序列能够杂交或退火至所述双链靶核酸被所述第二功能性单元断裂的位置处;在某些实施方案中,所述第二靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构。在某些实施方案中,所述3’端是因所述第二功能性单元断裂所述双链靶核酸而形成的。在某些实施方案中,所述第二标签序列不与所述靶核酸片段结合,处于游离的单链状态。
在某些实施方案中,所述第二靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二靶结合序列与所述第一靶结合序列不同。在某些实施方案中,所述第二靶结合序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的。在某些实施方案中,所述第二靶结合序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链。
在某些实施方案中,所述第二标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长。
在某些实施方案中,所述第二标签序列与所述第一标签序列相同或不同。在某些实施方案中,所述第二标签序列与所述第一标签序列不同。
在某些实施方案中,所述第二标签引物通过所述第二靶结合序列结合至所述断裂的靶核酸片段。在某些实施方案中,所述第二DNA聚合酶与所述断裂的靶核酸片段和所述第二标签引物结合。
在某些实施方案中,所述第二标签引物为单链脱氧核糖核酸或者单链核糖核酸。
在某些实施方案中,所述第二标签引物为单链核糖核酸,并且所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第二标签引物为单链脱氧核糖核酸,并且所述第二DNA聚合酶为依赖于DNA的DNA聚合酶。
在某些实施方案中,所述断裂的靶核酸片段被所述第二DNA聚合酶以所述第二标签引物为模板延伸,形成第二悬突。
在某些实施方案中,所述第二gRNA结合的核酸链与所述第二标签引物结合的核酸链是不同的;在某些实施方案中,所述第二gRNA结合的核酸链是所述第二标签引物结合的核酸链的相对链。
在某些实施方案中,所述第二标签引物与所述第二gRNA相连接。
在某些实施方案中,所述第二标签引物通过接头或者不通过接头与所述第二gRNA共价相连接。
在某些实施方案中,所述第二标签引物任选地通过接头连接至所述第二gRNA的3’端。
在某些实施方案中,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头)。
在某些实施方案中,所述第二标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第二gRNA的3’端相连接,形成第二PegRNA。
在某些实施方案中,所述第一和第二功能性单元以预定的位置关系结合双链靶核酸。
在某些实施方案中,所述第二引导序列与所述第一靶结合序列结合相同的核酸链;和/或,所述第一引导序列与所述第二靶结合序列结合相同的核酸链。
在某些实施方案中,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的上游或5’端;和/或,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的上游或5’端。
在某些实施方案中,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的下游或3’端;和/或,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的下游或3’端。
在某些实施方案中,所述双链靶核酸选自但不限于基因组DNA和核酸载体DNA。
在第七方面,本申请提供了一种方法,其用于将双链靶核酸断裂并在其3’端添加悬突,其中,所述方法包括,使用如前所述的系统或试剂盒。
在某些实施方案中,所述方法包括以下步骤:
i.提供双链靶核酸;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物接触。
在某些实施方案中,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,并且,所述第一功能性复合物结合并断裂所述双链靶核酸,形成断裂的靶核酸片段;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端;并且,
所述第一DNA聚合酶以退火至所述断裂的靶核酸片段的第一标签引物为模板,延伸所述断裂的靶核酸片段,形成第一悬突。
在某些实施方案中,所述方法在细胞内进行。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1以及所述第一标签引物或核酸分子D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1和所述第一标签引物或核酸分子D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1和D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子,以及含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物。
在某些实施方案中,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸。
在某些实施方案中,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如前述中所定义。
在某些实施方案中,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列。在某些实施方案中,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
在第八方面,本申请提供了一种方法,其用于将双链靶核酸断裂为靶核酸片段,并在所述靶核酸片段的两个3’端分别添加悬突,其中,所述方法包括,使用如前所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的。
在某些实施方案中,所述方法包括以下步骤:
i.提供双链靶核酸;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触。
在某些实施方案中,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,且所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物;并且,所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2。
在某些实施方案中,所述方法在细胞内进行。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2以及D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子A2和核酸分子B2包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A2和核酸分子B2在细胞中能够表达分离的所述第二Cas蛋白和所述第二DNA聚合酶,或者能够表达含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第二Cas蛋白和第二DNA聚合酶的核酸分子或者含有编码所述第二融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第二Cas蛋白和所述第二DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。在某些实施方案中,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物。
在某些实施方案中,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸。
在某些实施方案中,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如前述中所定义。
在某些实施方案中,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如前述中所定义。
在某些实施方案中,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列。在某些实施方案中,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
在某些实施方案中,所述第二Cas蛋白与所述第一Cas蛋白相同,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一和第二gRNA分别形成第一和第二功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物。
在某些实施方案中,在步骤i中,所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物。
在某些实施方案中,在步骤i中,所述核酸分子A1、B1、C1、D1、C2以及D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。在某些实施方案中,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物。
在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子以及含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物。
在第九方面,本申请提供了一种方法,其用于将靶核酸片段插入感兴趣的核酸分子;其中,所述方法包括,使用如前所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的,用于提供所述靶核酸片段;并且,所述第三双链靶核酸为感兴趣的核酸分子。
在某些实施方案中,所述方法包括:
a.通过如前述中所述的方法,将所述第一双链靶核酸断裂为靶核酸片段F1,并在所述靶核酸片段F1的两个3’端分别添加悬突,形成具有第一悬突和第二悬突的靶核酸片段F2;
b.用所述第三功能性复合物将所述感兴趣的核酸分子断裂,形成断裂的核苷酸片段a1和a2;以及,
c.用所述靶核酸片段F2连接所述核苷酸片段a1和a2,从而将所述靶核酸片段插入所述感兴趣的核酸分子。
在某些实施方案中,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三Cas蛋白和第三gRNA接触。
在某些实施方案中,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,且所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1和a2;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a2杂交或退火;并且,
所述靶核酸片段F2通过第一悬突和第二悬突分别与核苷酸片段a1和a2杂交或退火,进而被插入或连接至核苷酸片段a1和a2之间,从而,将所述靶核酸片段插入所述感兴趣的核酸分子中。
在某些实施方案中,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的。
在某些实施方案中,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’部分,且所述核苷酸片段a1的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第一间隔区域。
在某些实施方案中,所述第一间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt。
在某些实施方案中,所述第二悬突能够杂交或退火到所述核苷酸片段a2的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的。
在某些实施方案中,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’部分,且所述核苷酸片段a2的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第二间隔区域。
在某些实施方案中,所述第二间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt。
在某些实施方案中,所述方法在细胞内进行。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3和C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA。
在某些实施方案中,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸。
在某些实施方案中,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列。在某些实施方案中,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列;在某些实施方案中,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子是所述细胞的基因组DNA。
在某些实施方案中,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如前述中所定义。
在某些实施方案中,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如前述中所定义。
在某些实施方案中,所述第三Cas蛋白和第三gRNA如前述中所定义。
在某些实施方案中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一、第二和第三gRNA分别形成第一、第二和第三功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2和所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2以及C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。在某些实施方案中,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子以及含有编码所述第三gRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA。
第十方面,本申请提供了一种方法,其用于将靶核酸片段置换感兴趣的核酸分子中的核苷酸片段;其中,所述方法包括,使用如前所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的,用于提供所述靶核酸片段;并且,所述第三双链靶核酸与所述第四双链靶核酸是相同的,为感兴趣的核酸分子。
在某些实施方案中,所述方法包括:
a.通过如前所述的方法,将所述第一双链靶核酸断裂为靶核酸片段F1,并在所述靶核酸片段F1的两个3’端分别添加悬突,形成具有第一悬突和第二悬突的靶核酸片段F2;
b.用所述第三和第四功能性复合物断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;其中,在断裂之前,在所述感兴趣的核酸分子中,核苷酸片段a1、a2和a3依次排列(即,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连);以及,
c.用所述靶核酸片段F2连接所述核苷酸片段a1和a3,从而将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段。
在某些实施方案中,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA接触。
在某些实施方案中,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物,且所述第四Cas蛋白和第四gRNA相结合形成第四功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三和第四功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a3杂交或退火;并且,
所述靶核酸片段F2通过第一悬突和第二悬突分别与核苷酸片段a1和a3杂交或退火,进而连接在核苷酸片段a1和a3之间,从而,将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段;
在某些实施方案中,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的;
在某些实施方案中,所述第二悬突能够杂交或退火到所述核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述感兴趣的核酸分子而形成的。
在某些实施方案中,所述方法在细胞内进行。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3、所述第三gRNA或核酸分子C3、所述第四Cas蛋白或核酸分子A4、所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA。
在某些实施方案中,在步骤i中,所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3、所述第三gRNA或核酸分子C3、所述核酸分子A4以及所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA。
在某些实施方案中,在步骤i中,所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3、C3、A4和C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA。
在某些实施方案中,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸。
在某些实施方案中,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列。在某些实施方案中,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列以及第四Cas蛋白识别的第四PAM序列。在某些实施方案中,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂;并且,所述第四功能性复合物通过所述第四PAM序列和所述第四gRNA与所述感兴趣的核酸分子结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子是所述细胞的基因组DNA。
在某些实施方案中,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如前述中所定义。
在某些实施方案中,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如前述中所定义。
在某些实施方案中,所述第三Cas蛋白和第三gRNA如前述中所定义。
在某些实施方案中,所述第四Cas蛋白和第四gRNA如前述中所定义。
在某些实施方案中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一、第二、第三和第四gRNA分别形成第一、第二、第三和第四功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3和所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3和所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2、C3以及C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。在某些实施方案中,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物。
在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子、含有编码所述第三gRNA的核苷酸序列的核酸分子以及含有编码所述第四gRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA。
在某些实施方案中,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物;
ii将所述双链靶核酸与所述第一和第二Cas蛋白、第一和第二gRNA、第一和第二DNA聚合酶、第一和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三和第四Cas蛋白、第三和第四gRNA、第三和第四DNA聚合酶,以及第三和第四标签引物接触。
在某些实施方案中,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物,且所述第四Cas蛋白和第四gRNA相结合形成第四功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三和第四功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a3杂交或退火;并且,
所述第三标签引物通过所述第三靶结合序列杂交或退火至所述核苷酸片段a1的一条核酸链的3’端,其中,所述3’端是因所述第三功能性复合物断裂感兴趣的核酸分子而形成的;且,所述第四标签引物通过所述第四靶结合序列杂交或退火至所述核苷酸片段a3的一条核酸链的3’端,其中,所述3’端是因所述第四功能性复合物断裂感兴趣的核酸分子而形成的;并且,
所述第三DNA聚合酶以退火至所述核苷酸片段a1的第三标签引物为模板,延伸所述核苷酸片段a1,形成具有第三悬突的核苷酸片段a1;且,所述第四DNA聚合酶以退火至所述核苷酸片段a3的第四标签引物为模板,延伸所述核苷酸片段a3,形成具有第四悬突的核苷酸片段a3;其中,所述第三悬突和第四悬突分别能够与所述靶核酸片段F2杂交或退火;并且,
通过所述第一、第二、第三和第四悬突,所述靶核酸片段F2分别与核苷酸片段a1和a3杂交或退火,进而连接在核苷酸片段a1和a3之间,从而,将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段。
在某些实施方案中,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的。在某些实施方案中,所述第一悬突能够杂交或退火到核苷酸片段a1的第三悬突或其上游核苷酸序列。
在某些实施方案中,所述第二悬突能够杂交或退火到所述核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述感兴趣的核酸分子而形成的。在某些实施方案中,所述第二悬突能够杂交或退火到核苷酸片段a3的第四悬突或其上游核苷酸序列。
在某些实施方案中,所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火。
在某些实施方案中,所述方法在细胞内进行。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3、所述第三DNA聚合酶或核酸分子B3、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四Cas蛋白或核酸分子A4、所述第四DNA聚合酶或核酸分子B4、所述第四gRNA或核酸分子C4以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3、所述核酸分子B3、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述核酸分子A4、所述核酸分子B4、所述第四gRNA或核酸分子C4以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3、B3、C3、D3、A4、B4、C4、D4递送入细胞中,以在细胞内提供第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物。
在某些实施方案中,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸。
在某些实施方案中,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列;在某些实施方案中,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列以及第四Cas蛋白识别的第四PAM序列。在某些实施方案中,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂。并且,所述第四功能性复合物通过所述第四PAM序列和所述第四gRNA与所述感兴趣的核酸分子结合,并将其断裂。
在某些实施方案中,所述感兴趣的核酸分子是所述细胞的基因组DNA。
在某些实施方案中,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如前述中所定义。
在某些实施方案中,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如前述中所定义。
在某些实施方案中,所述第三Cas蛋白、第三gRNA、第三DNA聚合酶或第三标签引物如前述中所定义。
在某些实施方案中,第四Cas蛋白、第四gRNA、第四DNA聚合酶或第四标签引物如前述中所定义。
在某些实施方案中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,并且所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶;其中,所述第一Cas蛋白与所述第一、第二、第三和第四gRNA分别形成第一、第二、第三和第四功能性复合物;并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;并且,所述第一DNA聚合酶分别以第三标签引物和第四标签引物为模板,延伸所述核苷酸片段a1和a3,形成第三和第四悬突。
在某些实施方案中,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四gRNA或核酸分子C4、以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四gRNA或核酸分子C4、以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物。
在某些实施方案中,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2、C3、D3、C4和D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物。
在某些实施方案中,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白。在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶。
在某些实施方案中,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA。在某些实施方案中,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物。
在某些实施方案中,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA。在某些实施方案中,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物。
在某些实施方案中,所述核酸分子C3和核酸分子D3包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C3和核酸分子D3在细胞中能够转录出含有所述第三gRNA和所述第三标签引物的第三PegRNA。在某些实施方案中,在步骤i中,将所述第三PegRNA递送入细胞中以在细胞内提供所述第三gRNA和所述第三标签引物,或者,将含有编码所述第三PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第三PegRNA,以在细胞内提供所述第三gRNA和所述第三标签引物。
在某些实施方案中,所述核酸分子C4和核酸分子D4包含于相同的表达载体(例如,真核表达载体)中。在某些实施方案中,所述核酸分子C4和核酸分子D4在细胞中能够转录出含有所述第四gRNA和所述第四标签引物的第四PegRNA。在某些实施方案中,在步骤i中,将所述第四PegRNA递送入细胞中以在细胞内提供所述第四gRNA和所述第四标签引物,或者,将含有编码所述第四PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第四PegRNA,以在细胞内提供所述第四gRNA和所述第四标签引物。
在某些实施方案中,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子、含有编码所述第三PegRNA的核苷酸序列的核酸分子以及含有编码所述第四PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中表达第一融合蛋白和转录第一、第二、第三和第四PegRNA,从而在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物。
发明的有益效果
与现有技术相比,本申请提供的核酸编辑系统、试剂盒和方法能够断裂双链核酸,并在其末端(3’末端)延伸/添加一段或两段任意碱基序列的悬突。在此基础上,本申请的系统、试剂盒和方法能够实现高效、精确的外源核酸(特别是大片段外源核酸)的插入和置换。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
图1显示了本发明方法介导外源基因插入基因组的原理的示意图。其中,黑色双实线代表基因组序列或供体载体的骨架序列;蓝色双实线代表待插入的外源基因;灰色虚线圈中的橙色和绿色单条实线代表延伸的第一悬突和第二悬突,灰色虚线圈中的橙色和绿色双实线代表基因组断裂处末端分别与第一悬突和第二悬突互补的第一同源序列和第二同源序列;黑色实心三角指示基因组特异位点spacerX,其能够被Cas9-MLV-RT/GeneX-gRNA(由Cas9蛋白、逆转录酶(MLV-RT)和GeneX-gRNA形成的复合物)识别并切割;黑色空心三角指示供体载体上外源基因上游的sapcerA位点,其能够被Cas9-MLV-RT/spacerA-pegRNA(由Cas9蛋白、逆转录酶(MLV-RT)和spacerA-pegRNA形成的复合物)识别并切割;灰色空心三角指示供体载体上外源基因下游的sapcerK位点,其能够被Cas9-MLV-RT/spacerK-pegRNA(由Cas9蛋白、逆转录酶(MLV-RT)和spacerK-pegRNA形成的复合物)识别并切割;并且,spacerA和sapcerK彼此位于相对的核酸链上。
sapcerA位点被Cas9-MLV-RT/spacerA-pegRNA识别并切割,其中,spacerA-pegRNA含有第一靶结合序列和第一标签序列(其与第一同源序列的一条链互补),第一靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第一标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第一标签引物为模板,延伸所述核酸链的3’端,形成了第一悬突(即橙色单条实线,其长度可以为例如35nt)。同理,spacerK位点被Cas9-MLV-RT/spacerK-pegRNA识别并切割,其中,spacerK-pegRNA含有第二靶结合序列和第二标签序列(其与第二同源序列的一条链互补),第二靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第二标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第二标签引物为模板,延伸所述核酸链的3’端,形成了第二悬突(即绿色单条实线,其长度可以为例如35nt)。通过双重切割,外源基因片段被从载体中切割出来,且在两端被添加了第一悬突和第二悬突。
此外,spacerX位点被Cas9-MLV-RT/GeneX-gRNA识别并切割,形成断裂的基因组;并且,断裂位点处的两个末端分别含有第一同源序列(与第一悬突互补)和第二同源序列(与第二悬突互补)。由此,带有第一悬突和第二悬突的外源基因片段可通过链间退火整合到基因组的断裂位点,实现外源基因的定点插入。
图2显示了本发明方法介导外源基因替换基因组的特定核苷酸片段的原理的示意图。其中,黑色双实线表示基因组序列或供体载体的骨架序列;黑色双虚线代表拟被替换的基因组片段;蓝色双实线代表待替换的外源插入基因;灰色虚线圈中相同颜色的实线代表能够彼此互补的同源序列,橙色单条实线代表延伸的第一悬突,绿色单条实线代表延伸的第二悬突,红色单条实线代表延伸的第三悬突,紫色单条实线代表延伸的第四悬突;黑色实心三角指示基因组上拟替换片段上游的切割位点RC-PegRNA,其可以被Cas9-MLV-RT/RC-PegRNA(由Cas9蛋白、逆转录酶(MLV-RT)和RC-PegRNA形成的复合物)识别、切割和延伸;灰色实心三角指示基因组上拟替换片段下游的切割位点RT-PegRNA,其可以被Cas9-MLV-RT/RT-PegRNA(由Cas9蛋白、逆转录酶(MLV-RT)和RT-PegRNA形成的复合物)识别、切割和延伸;黑色空心三角代表供体载体上外源插入片段上游的切割位点RC-pegA,其可以被Cas9-MLV-RT/RC-pegA识别、切割和延伸;灰色空心三角代表供体载体上外源插入片段下游的切割位点RT-pegK,其可以被Cas9-MLV-RT/RT-pegK识别、切割和延伸;RC-pegA和RT-pegK位点彼此位于相对的核酸链上;且RC-PegRNA和RT-PegRNA位点彼此位于相对的核酸链上。
位点RC-pegA被Cas9-MLV-RT/RC-PegRNA识别和切割,其中,RC-PegRNA含有第一靶结合序列和第一标签序列(其与第一同源序列的一条链互补),第一靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第一标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第一标签引物为模板,延伸所述核酸链的3’端,形成第一悬突(即橙色单条实线),并且,第一悬突能够与RC-PegRNA位点上游的核苷酸序列(橙色双实线)互补。
同理,位点RT-pegK被Cas9-MLV-RT/RT-pegK识别和切割,其中,RT-pegK含有第二靶结合序列和第二标签序列(其与第二同源序列的一条链互补),第二靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第二标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第二标签引物为模板,延伸所述核酸链的3’端,形成第二悬突(即绿色单条实线),并且,第二悬突能够与RT-PegRNA位点下游的核苷酸序列(绿色双实线)互补。
通过双重切割,外源基因片段被从载体中切割出来,且在两端被添加了第一悬突和第二悬突。
位点RC-PegRNA被Cas9-MLV-RT/RC-PegRNA识别并切割,其中,RC-PegRNA含有第三靶结合序列和第三标签序列(其与第三同源序列的一条链互补),第三靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第三标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第三标签引物为模板,延伸所述核酸链的3’端,形成了第三悬突(即红色单条实线),并且,第三悬突能够与RC-pegA位点下游的核苷酸序列(红色双实线)互补。
位点RT-PegRNA被Cas9-MLV-RT/RT-PegRNA识别并切割,其中,RT-PegRNA含有第四靶结合序列和第四标签序列(其与第四同源序列的一条链互补),第四靶结合序列杂交至切割后的靶核酸片段的一条核酸链的3’端,形成双链结构,并且,第四标签序列不与所述靶核酸片段结合,处于游离的单链状态。因此,逆转录酶(MLV-RT)能够以第四标签引物为模板,延伸所述核酸链的3’端,形成了第四悬突(即紫色单条实线),并且,第四悬突能够与RT-pegK位点上游的核苷酸序列(紫色双实线)互补。
通过双重切割,拟被替换的片段被从基因组中切除,且断裂的基因组两端被添加了第三悬突和第四悬突。
由此,带有第一、第二悬突的外源基因片段可通过链间退火插入到带有第三、第四悬突的断裂的基因组中,从而实现基因组上特定核苷酸片段的替换。
图3显示了在人细胞基因组的GAPDH基因中定点敲入外源基因(IRES-EGFP)的流程示意图。
图4显示了使用本发明方法在人细胞基因组的GAPDH基因中定点敲入外源基因(IRES-EGFP)的结果示意图。图4A显示了通过流式细胞荧光分选技术(FACS)分析不同方法产生的EGFP阳性细胞的比率。图4B为通过PCR对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定的结果。图4C为对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行Sanger法测序的结果。
图5显示了在人细胞基因组的ACTB基因中定点敲入外源基因(IRES-EGFP)的流程示意图。
图6显示了使用本发明方法在人细胞基因组的ACTB基因中定点敲入外源基因(IRES-EGFP)的结果示意图。图6A显示了通过流式细胞荧光分选技术(FACS)分析不同方法产生的EGFP阳性细胞的比率。图6B为对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定的结果。图6C为对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行Sanger法测序的结果。
图7显示了用含有外源基因(T2A-EGFP)的靶核酸片段定点置换人细胞基因组的GAPDH基因中的核苷酸片段的流程示意图。
图8显示了使用本发明方法,用含有外源基因(T2A-EGFP)的靶核酸片段定点置换人细胞基因组的GAPDH基因中的核苷酸片段的效率。
图9显示了使用HDR方法和本发明方法(EPTI)在293T细胞的ACTB基因的终止密码子前定点敲入外源基因(T2A-EGFP),从而使T2A-EGFP与ACTB基因融合表达的结果示意图。
图9A显示了HDR和EPTI介导外源基因(T2A-EGFP)在ACTB基因的终止密码子前定点敲入的示意图。
图9B显示了EPTI介导外源基因(T2A-EGFP)在ACTB基因的终止密码子前定点敲入的序列示意图;
其中,第一排序列表示人ACTB基因序列;蓝色序列表示ACTB基因的蛋白编码序列(该蓝色序列也为同源序列);黑色三角表示基因组被靶向的切割位点(sgACTB2);其中,TAG为终止密码子,基因组靶向的切割位点在终止密码子的“T”碱基与“A”碱基之间。
第二排序列表示供体载体的序列,其中,黑色三角表示供体载体上外源基因的上游被靶向的切割位点。根据如上所描述的,当该位点被Cas9-MLV-RT和pegRNA的复合物识别并切割,pegRNA会延伸所述外源基因上游核酸链的3’端,形成一段悬突序列。
第三排序列表示外源基因上游的悬突序列与ACTB基因同源序列链间退火后的序列;由于链间退火,ACTB基因同源序列与断裂位点之间的间隔序列(例如,碱基“T”)形成了游离的碱基;
其中,蓝色序列为ACTB基因的同源序列;位于灰色框内的蓝色序列为外源基因上游形成的悬突序列;位于灰色框内的红色序列为供体载体的序列;
第四排序列表示完成了外源基因(T2A-EGFP)在ACTB基因的终止密码子前定点敲入的序列,其中,游离的“T”碱基被切除,实现了开放阅读框的连续和蛋白的融合表达。
图9C显示HDR和EPTI介导外源基因(T2A-EGFP)在ACTB基因的终止密码子前定点敲入的效率比较。
图9D为对报告基因EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定的结果。
序列信息
本发明涉及的部分序列的信息提供于下面的表1中。
表1:序列的描述
Figure BDA0003156532070000461
Figure BDA0003156532070000471
Figure BDA0003156532070000481
Figure BDA0003156532070000491
Figure BDA0003156532070000501
Figure BDA0003156532070000511
Figure BDA0003156532070000521
Figure BDA0003156532070000531
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。
除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。例如,本发明中所使用的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA等常规技术,可参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989);《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR 2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995)),以及《动物细胞培养》(ANIMAL CELLCULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
实施例1.使用EPTI系统将外源基因定点插入人GAPDH基因
为了验证EPTI系统将外源基因定点插入基因组的效果,本实施例设计了如下实验:使用EPTI系统将报告基因IRES-EGFP定点敲入人基因组GAPDH的3’UTR区,并且以HITI系统作为对照。EPTI系统定点插入外源基因的原理如图1所示,在人细胞基因组的GAPDH基因中定点敲入外源基因(IRES-EGFP)的具体流程如图3所示。
GAPDH基因位于12号染色体,编码甘油醛-3-磷酸脱氢酶,是重要的管家基因,在293T细胞中的表达丰度高。报告基因被敲入GAPDH的3’UTR区后能够随GAPDH基因一起转录,并且,其中的IRES序列可以招募核糖体,从而使EGFP得以表达。EGFP的荧光信号可方便地通过荧光显微镜直接观察和定量,并且表达EGFP的细胞可通过流式细胞术进行捕捉和定量。
本实施例使用的pCAG-Cas9-mCherry质粒(其能够表达Cas9蛋白(SEQ ID NO:1)和mCherry蛋白(SEQ ID NO:2))和pUC19-U6-gRNA(其能够转录缺少引导序列的gRNA(SEQ IDNO:3))均获自中国科学院动物研究所李伟课题组。
从addgene公司的pCMV-PE2(#132775)质粒上扩增得到编码MLV-TR(SEQ ID NO:4)的核苷酸片段,且从pCAG-Cas9-mCherry质粒上扩增出编码Cas9的部分核苷酸片段和编码mCherry的核苷酸片段。通过In-fusion克隆技术将上述扩增的核苷酸片段连接到AscI/BsrGI双酶切的pCAG-Cas9-mCherry质粒上,得到pCAG-Cas9-MLV RT-mCherry质粒,其能够表达Cas9蛋白,MLV-TR蛋白和mCherry蛋白。
将引物Gapdh-gRNA-F(SEQ ID NO:5)和Gapdh-gRNA-R(SEQ ID NO:6)退火并用T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒上,得到pUC19-U6-Gapdh-gRNA质粒,其能够转录出Gapdh-gRNA(SEQ ID NO:7),引导Cas9蛋白靶向人GAPDH位点的3’URT区。
将引物spacerA-gRNA-F(SEQ ID NO:17)和spacerA-gRNA-R(SEQ ID NO:18)退火并通过T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒载体上,得到pUC19-U6-spacerA-gRNA质粒,其能够转录出spacerA-gRNA(SEQ ID NO:19),引导Cas9蛋白靶向spacer A序列(SEQ ID NO:49)。
将引物spacerK-gRNA-F(SEQ ID NO:20)和spacerK-gRNA-R(SEQ ID NO:21)退火并通过T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒载体上,得到pUC19-U6-spacerK-gRNA质粒,其能够转录出spacerK-gRNA(SEQ ID NO:22),引导Cas9蛋白靶向spacer K序列(SEQ ID NO:50)。
将引物Gapdh-pegA-F(SEQ ID NO:23)和Gapdh-pegA-R(SEQ ID NO:24)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerA-gRNA质粒载体上,得到pUC19-U6-Gapdh-pegA质粒,其能够转录出Gapdh-pegA(SEQID NO:25),引导Cas9蛋白靶向spacerA序列(SEQ ID NO:49)。
将引物Gapdh-pegK-F(SEQ ID NO:26)和Gapdh-pegK-R(SEQ ID NO:27)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerK-gRNA质粒载体上,得到pUC19-U6-Gapdh-pegK质粒,其能够转录出Gapdh-pegK(SEQID NO:28),引导Cas9蛋白靶向spacerK序列(SEQ ID NO:50)。
报告基因IRES-EGFP(SEQ ID NO:47)由捷瑞公司合成,并通过T4连接酶连接到EcoRV酶切的pGH载体(捷瑞公司提供)上,作为供体载体。报告基因的两侧分别具有spacerA-gRNA/Gapdh-pegA和spacerK-gRNA/Gapdh-pegK的识别和切割位点spacerA和spacerK(序列分别为SEQ ID NO:49和SEQ ID NO:50)。
在EPTI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-MLV RT-mCherry、Gapdh-gRNA、Gapdh-pegA、Gapdh-pegK连同供体载体转染到293T细胞中。在EPTI系统的阴性对照组中,将pCAG-Cas9-MLV RT-mCherry、Gapdh-pegA、Gapdh-pegK连同供体载体转染到293T细胞中。293T细胞系来自ATCC细胞库。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。在HITI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-mCherry、Gapdh-gRNA、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。在HITI系统的阴性对照组中,将pCAG-Cas9-mCherry、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。比较两个不同系统的EGFP阳性细胞的比例,可以反应两个系统在GAPDH基因的定点敲入的效率的差异。外源基因整合效率结果如图4A所示。结果显示,HITI系统中EGFP阳性细胞的比率在5%以下,而EPTI系统中,EGFP阳性细胞的比率超过60%。并且在去除Gapdh-gRNA组分的阴性对照组中,HITI系统和EPTI系统均检测不到EGFP阳性细胞,表明EGFP阳性细胞可以反映供体载体上的外源基因IRES-EGFP在人GAPDH靶位点的特异性整合。
提取EGFP阳性细胞的基因组DNA,然后分别用引物GAPDH-P1(SEQ ID NO:68)/GAPDH-P2(SEQ ID NO:69)、GAPDH-P3(SEQ ID NO:70)/GAPDH-P4(SEQ ID NO:71)对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定和Sanger法测序分析。
PCR鉴定结果如图4B所示。结果显示,所使用的引物对GAPDH-P1/GAPDH-P2和GAPDH-P3/GAPDH-P4能够以EGFP阳性细胞的基因组DNA为模板,扩增产生具有预期大小的两个扩增片段。Sanger测序分析结果如图4C所示。结果显示,本申请的EPTI方法能够高效、定点、准确地介导外源基因连接到基因组DNA的断裂末端。综上可知,本发明描述的EPTI系统可以大幅提高外源基因的定点整合效率。
实施例2.使用EPTI系统将外源基因定点插入人ACTB基因
为了验证EPTI系统将外源基因定点插入基因组的效果,本实施例设计了如下实验:使用EPTI系统将报告基因IRES-EGFP(SEQ ID NO:47)定点敲入人基因组ACTB的3’UTR区,并且以HITI系统作为对照。人细胞基因组的ACTB基因中定点敲入外源基因(IRES-EGFP)的具体流程如图5所示。报告基因的合成与切割步骤同实施例1。
将引物Actb-gRNA-F(SEQ ID NO:8)和Actb-gRNA-R(SEQ ID NO:9)退火并用T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒上,得到pUC19-U6-Actb-gRNA质粒,其能够转录出Actb-gRNA(SEQ ID NO:10),引导Cas9蛋白靶向人ACTB位点的3’URT区。
将引物Actb-pegA-F(SEQ ID NO:29)和Actb-pegA-R(SEQ ID NO:30)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerA-gRNA质粒载体上,得到pUC19-U6-Actb-pegA质粒,其能够转录出Actb-pegA(SEQID NO:31),引导Cas9蛋白靶向spacer A序列(SEQ ID NO:49)。
将引物Actb-pegK-F(SEQ ID NO:32)和Actb-pegK-R(SEQ ID NO:33)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerK-gRNA质粒载体上,得到pUC19-U6-Actb-pegK质粒,其能够转录出Actb-pegK(SEQID NO:34),引导Cas9蛋白靶向spacer K序列(SEQ ID NO:50)。
在EPTI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-MLV RT-mCherry、Actb-gRNA、Actb-pegA、Actb-pegK连同供体载体转染到293T细胞中。在EPTI系统的阴性对照组中,将pCAG-Cas9-MLV RT-mCherry、Actb-pegA、Actb-pegK连同供体载体转染到293T细胞中。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。在HITI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-mCherry、Actb-gRNA、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。在HITI系统的阴性对照组中,将pCAG-Cas9-mCherry、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。比较两个不同系统的EGFP阳性细胞的比例,可以反应两个系统在ACTB基因的定点敲入的效率的差异。不同方法的外源基因整合效率比较结果如图6A所示。结果显示,HITI系统中EGFP阳性细胞的比率在8%以下,而EPTI系统中,EGFP阳性细胞的比率超过50%。并且在去除Actb-gRNA组分的阴性对照组中,HITI系统和EPTI系统均检测不到EGFP阳性细胞,表明EGFP阳性细胞可以反映供体载体上的外源基因IRES-EGFP在人ACTB靶位点的特异性整合。
提取EGFP阳性细胞的基因组DNA,然后分别用引物ACTB-P1(SEQ ID NO:72)/ACTB-P2(SEQ ID NO:73)、ACTB-P3(SEQ ID NO:74)/ACTB-P4(SEQ ID NO:75)对报告基因IRES-EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定和Sanger法测序分析。
PCR鉴定结果如图6B所示。结果显示,所使用的引物对ACTB-P1/ACTB-P2、ACTB-P3/ACTB-P4能够以EGFP阳性细胞的基因组DNA为模板,扩增产生具有预期大小的两个扩增片段。Sanger法测序分析结果如图6C所示。结果显示,本申请的EPTI方法能够高效、定点、准确地介导外源基因连接到基因组DNA的断裂末端。综上可知,本发明描述的EPTI系统可以大幅提高外源基因的定点整合效率。
实施例3.使用EPTI系统用外源基因定点置换人GAPDH基因中的核苷酸片段
为了验证EPTI系统将外源基因定点置换入基因组的效果,本实施例设计了如下实验:使用EPTI系统将含有报告基因T2A-EGFP的DNA片段(SEQ ID NO:48)定点置换人基因组GAPDH基因的一段DNA序列,并且以HITI系统作为对照。EPTI方法介导外源基因替换基因组的特定核苷酸片段的原理的示意图如图2所示,含有外源基因(T2A-EGFP)的靶核酸片段定点置换人细胞基因组的GAPDH基因中的核苷酸片段的具体流程如图7所示。报告基因的合成与切割步骤与实施例1中描述的类似。
将引物GapdhRC-gRNA-F(SEQ ID NO:11)和GapdhRC-gRNA-F(SEQ ID NO:12)退火并用T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒上,得到pUC19-U6-GapdhRC-gRNA质粒,其能够转录出GapdhRC-gRNA(SEQ ID NO:13),引导Cas9蛋白靶向人GAPDH基因的4号和5号外显子之间的内含子区。
将引物GapdhRT-gRNA-F(SEQ ID NO:14)和GapdhRT-gRNA-R(SEQ ID NO:15)退火并用T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒上,得到pUC19-U6-GapdhRT-gRNA质粒,其能够转录出GapdhRT-gRNA(SEQ ID NO:16),引导Cas9蛋白靶向人GAPDH基因的下游区域。
将引物GapdhRC-pegRNA-F(SEQ ID NO:35)和GapdhRC-pegRNA-F(SEQ ID NO:36)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-GapdhRC-gRNA质粒载体上,得到pUC19-U6-GapdhRC-pegRNA质粒,其能够转录出GapdhRC-pegRNA(SEQ ID NO:37),引导Cas9蛋白靶向人GAPDH基因的4号和5号外显子之间的内含子区。
将引物GapdhRT-pegRNA-F(SEQ ID NO:38)和GapdhRT-pegRNA-F(SEQ ID NO:39)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-GapdhRT-gRNA质粒载体上,得到pUC19-U6-GapdhRT-pegRNA质粒,其能够转录出GapdhRT-pegRNA(SEQ ID NO:40),引导Cas9蛋白靶向人GAPDH基因的下游区域。
将引物GapdhRC-pegA-F(SEQ ID NO:41)和GapdhRC-pegA-R(SEQ ID NO:42)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerA-gRNA质粒载体上,得到pUC19-U6-GapdhRC-pegA质粒,其能够转录出GapdhRC-pegA(SEQ ID NO:43),引导Cas9蛋白靶向spacerA序列(SEQ ID NO:49)。
将引物GapdhRT-pegK-F(SEQ ID NO:44)和GapdhRT-pegK-R(SEQ ID NO:45)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-spacerK-gRNA质粒载体上,得到pUC19-U6-GapdhRT-pegK质粒,其能够转录出GapdhRT-pegK(SEQ ID NO:46),引导Cas9蛋白靶向spacerK序列(SEQ ID NO:50)。
含报告基因T2A-EGFP的外源基因片段(SEQ ID NO:48)由捷瑞公司合成,并通过T4连接酶连接到EcoRV酶切的pGH载体(捷瑞公司提供)上,作为供体载体。报告基因的两侧分别具有spacerA-gRNA/Gapdh-pegA和spacerK-gRNA/Gapdh-pegK的识别和切割位点spacerA和spacerK(序列分别为SEQ ID NO:49和SEQ ID NO:50)。
在EPTI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-MLV RT-mCherry、GapdhRC-pegRNA、GapdhRT-pegRNA、GapdhRC-pegA、GapdhRT-pegK、连同供体载体转染到293T细胞中。在EPTI系统的阴性对照组中,将pCAG-Cas9-MLV RT-mCherry、GapdhRC-pegA、GapdhRT-pegK连同供体载体转染到293T细胞中。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。在HITI系统的实施中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-mCherry、GapdhRC-gRNA、GapdhRT-gRNA、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。在HITI系统的阴性对照组中,将pCAG-Cas9-mCherry、spacerA-gRNA、spacerK-gRNA连同供体载体转染到293T细胞中。转染24小时后在流式细胞仪分选mCherry阳性的细胞,分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。比较两个不同系统的EGFP阳性细胞的比例,可以反应两个系统在GAPDH基因的定点置换的效率的差异。
实验结果如图8所示,HITI系统中EGFP阳性细胞的比率在3%左右,而EPTI系统中,EGFP阳性细胞的比率高于30%。并且在去除靶向GAPDH基因的sgRNA/pegRNA组分的阴性对照组中,HITI系统和EPTI系统均检测不到EGFP阳性细胞,表明EGFP阳性细胞可以反映供体载体上整合了T2A-EGFP的外源基因片段在人GAPDH靶位点与基因组片段发生了定点置换。综上可知,本发明描述的EPTI系统可以大幅提高外源基因在人GAPDH基因位点定点置换的效率。
实施例4.使用EPTI系统将外源基因定点插入ACTB基因的终止密码子前,以表达 ACTB-T2A-EGFP融合蛋白
为了进一步验证EPTI系统将外源基因精确定点插入基因组的效果,本实施例设计了如下实验:使用EPTI系统将报告基因T2A-EGFP(SEQ ID NO:82)定点敲入293T细胞ACTB基因的终止密码子之前,并且以HDR系统作为对照。在293T细胞基因组的ACTB基因中定点敲入外源基因(T2A-EGFP)的流程如图9A和9B所示。
如图9B所示,ACTB基因被靶向的切割位点并不在最后一个编码密码子和终止密码子之间,而是在终止密码子的碱基“T”和碱基“A”之间。为了使外源基因片段(T2A-EGFP)能够正好插入到ACTB基因的最后一个编码密码子之后,与ACTB基因融合表达,在基因组的编辑过程中需要将终止密码子的碱基“T”去除。为此目的,设计pegRNA中的标签序列,使得所产生的外源基因片段上的悬突(第一悬突)与ACTB基因被靶向切割的位点上游互补;也即,使得第一悬突所靶向结合的基因组序列与ACTB基因被靶向切割的位点之间存在间隔序列(在本实施例中,间隔序列即为需要去除的碱基“T”)。借助于该设计,第一悬突在与其靶向结合的基因组序列链间退火后,间隔序列将呈游离状态,并会被切除;由此,外源基因片段(T2A-EGFP)能够精确地连接到ACTB基因最后一个编码密码子之后。
本实施例使用的pCAG-Cas9-mCherry质粒、pCAG-Cas9-MLV RT-mCherry与实施例1相同。
将引物sgACTB2-F(SEQ ID NO:53)和sgACTB2-R(SEQ ID NO:54)退火并用T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒上,得到pUC19-U6-sgACTB2质粒,其能够转录出sgACTB2(SEQ ID NO:55),引导Cas9蛋白靶向切割293T细胞ACTB基因的特异位点(即,在ACTB基因终止密码子的碱基“T”和碱基“A”之间进行切割)。
将引物ACTB2-sgL-F(SEQ ID NO:56)和ACTB2-sgL-R(SEQ ID NO:57)退火并通过T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒载体上,得到pUC19-U6-ACTB2-sgL质粒,其能够转录出ACTB2-sgL(SEQ ID NO:58)。
将引物ACTB2-sgR-F(SEQ ID NO:59)和ACTB2-sgR-R(SEQ ID NO:60)退火并通过T4连接酶连接到用BsaI酶切的pUC19-U6-gRNA质粒载体上,得到pUC19-U6-ACTB2-sgR质粒,其能够转录出ACTB2-sgR(SEQ ID NO:61)。
将引物ACTB2-pegL-F(SEQ ID NO:62)和ACTB2-pegL-R(SEQ ID NO:63)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-ACTB2-sgL质粒载体上,得到pUC19-U6-ACTB2-pegL质粒,其能够转录出ACTB2-pegL(SEQ IDNO:64),引导Cas9蛋白靶向spacer L序列(SEQ ID NO:80)。
将引物ACTB2-pegR-F(SEQ ID NO:65)和ACTB2-pegR-R(SEQ ID NO:66)进行重叠延伸PCR,得到的片段回收后通过In-fusion克隆技术连接到HindIII酶切的pUC19-U6-ACTB-pegR质粒载体上,得到pUC19-U6-ACTB-pegR质粒,其能够转录出ACTB2-pegR(SEQ IDNO:67),引导Cas9蛋白靶向spacerR序列(SEQ ID NO:81)。
报告基因T2A-EGFP(SEQ ID NO:82)由捷瑞公司合成,并通过T4连接酶连接到EcoRV酶切的pGH载体(捷瑞公司提供)上,作为供体载体。对于EPTI系统的供体载体,报告基因T2A-EGFP的两侧分别具有spacer L序列(SEQ ID NO:80),与T2A-EGFP基因反向;和spacer R序列(SEQ ID NO:81),与T2A-EGFP基因同向。对于HDR系统的供体载体,报告基因T2A-EGFP的两侧分别具有左侧同源臂ACTB2 LHA(SEQ ID NO:83)和右侧同源臂ACTB2 RHA(SEQ ID NO:84)。
在使用EPTI系统的实验中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-MLV RT-mCherry、U6-sgACTB2、U6-ACTB2-pegL、U6-ACTB2-pegR连同供体载体转染到293T细胞中。在EPTI系统的阴性对照组中,将pCAG-Cas9-MLV RT-mCherry、U6-ACTB2-pegL、U6-ACTB2-pegR连同供体载体转染到293T细胞中。在使用HDR系统的实验中,用Invitrogen公司的Lipofectamine 3000脂质体转染试剂将pCAG-Cas9-mCherry、U6-sgACTB2连同HDR供体载体转染到293T细胞中。在HDR系统的阴性对照组中,将pCAG-Cas9-mCherry连同HDR供体载体转染到293T细胞中。293T细胞系来自ATCC细胞库。转染24小时后在流式细胞仪分选mCherry阳性的细胞,即为成功转染的细胞。分选得到的细胞继续培养5天后,用流式细胞仪分析EGFP阳性细胞的比率。比较两个不同系统的EGFP阳性细胞的比例,可以反应不同系统在ACTB基因上定点敲入的效率的差异。使用不同方法插入外源基因的效率的比较结果如图9C所示。结果显示,在使用EPTI系统的情况下,EGFP阳性细胞的比率在30%左右,明显高于使用HDR系统的方法。
将培养5天后的EGFP阳性细胞进行基因组DNA提取,然后分别用引物ACTB2-P1(SEQID NO:76)/ACTB2-P2(SEQ ID NO:77)、ACTB2-P3(SEQ ID NO:78)/ACTB2-P4(SEQ ID NO:79)对报告基因EGFP(5’端和3’端)与基因组DNA连接处的核苷酸序列进行PCR鉴定。
PCR鉴定结果如图9D所示。结果显示,所使用的引物对ACTB2-P1/ACTB2-P2、ACTB2-P3/ACTB2-P4能够以EGFP阳性细胞的基因组DNA为模板,扩增产生具有预期大小的两个扩增片段。这些结果表明,本发明的EPTI系统可以将外源基因(T2A-EGFP)定点、准确地插入293T细胞ACTB基因的特定位置处。此外,这些结果还标明,在悬突所靶向结合的基因组序列与基因组被靶向切割的位点之间存在间隔的情况下,本发明的EPTI系统仍然可以大幅提高外源基因在靶基因组中的定点整合效率。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。
SEQUENCE LISTING
<110> 中国科学院动物研究所、北京干细胞与再生医学研究院
<120> 一种编辑核酸的系统及方法
<130> IDC210247
<150> 202010663076.8
<151> 2020-07-10
<160> 84
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> artificial
<220>
<223> Cas9蛋白
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 236
<212> PRT
<213> artificial
<220>
<223> mCherry
<400> 2
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 3
<211> 76
<212> DNA
<213> artificial
<220>
<223> 缺少引导序列的gRNA
<400> 3
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 4
<211> 722
<212> PRT
<213> artificial
<220>
<223> MLV RT
<400> 4
Met Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
1 5 10 15
Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr
20 25 30
Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr
35 40 45
Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly
50 55 60
Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser
65 70 75 80
Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
85 90 95
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val
100 105 110
Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro
115 120 125
Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys
130 135 140
Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu
145 150 155 160
Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys
165 170 175
Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe
180 185 190
Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr
195 200 205
Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn
210 215 220
Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp
225 230 235 240
Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser
245 250 255
Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly
260 265 270
Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys
275 280 285
Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu
290 295 300
Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr
305 310 315 320
Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
325 330 335
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr
340 345 350
Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr
355 360 365
Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro
370 375 380
Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr
385 390 395 400
Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val
405 410 415
Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro
420 425 430
Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly
435 440 445
Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val
450 455 460
Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg
465 470 475 480
Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe
485 490 495
Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu
500 505 510
Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly
515 520 525
Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr
530 535 540
Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala
545 550 555 560
Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu
565 570 575
Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln
580 585 590
Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser
595 600 605
Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg
610 615 620
Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu
625 630 635 640
Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile
645 650 655
Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly
660 665 670
Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr
675 680 685
Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly
690 695 700
Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg
705 710 715 720
Lys Val
<210> 5
<211> 24
<212> DNA
<213> artificial
<220>
<223> Gapdh-gRNA-F
<400> 5
ccggagagag agaccctcac tgct 24
<210> 6
<211> 24
<212> DNA
<213> artificial
<220>
<223> Gapdh-gRNA-R
<400> 6
aaacagcagt gagggtctct ctct 24
<210> 7
<211> 96
<212> DNA
<213> artificial
<220>
<223> Gapdh-gRNA
<400> 7
agagagagac cctcactgct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 8
<211> 24
<212> DNA
<213> artificial
<220>
<223> Actb-gRNA-F
<400> 8
ccggatcccc caaagttcac aatg 24
<210> 9
<211> 24
<212> DNA
<213> artificial
<220>
<223> Actb-gRNA-R
<400> 9
aaaccattgt gaactttggg ggat 24
<210> 10
<211> 96
<212> DNA
<213> artificial
<220>
<223> Actb-gRNA
<400> 10
atcccccaaa gttcacaatg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 11
<211> 24
<212> DNA
<213> artificial
<220>
<223> GapdhRC-gRNA-F
<400> 11
ccggtagcgt tgacccgacc ccaa 24
<210> 12
<211> 24
<212> DNA
<213> artificial
<220>
<223> GapdhRC-gRNA-R
<400> 12
aaacttgggg tcgggtcaac gcta 24
<210> 13
<211> 96
<212> DNA
<213> artificial
<220>
<223> GapdhRC-gRNA
<400> 13
tagcgttgac ccgaccccaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 14
<211> 24
<212> DNA
<213> artificial
<220>
<223> GapdhRT-gRNA-F
<400> 14
ccgggtaagc acacgtgcaa agtg 24
<210> 15
<211> 24
<212> DNA
<213> artificial
<220>
<223> GapdhRT-gRNA-R
<400> 15
aaaccacttt gcacgtgtgc ttac 24
<210> 16
<211> 96
<212> DNA
<213> artificial
<220>
<223> GapdhRT-gRNA
<400> 16
gtaagcacac gtgcaaagtg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 17
<211> 24
<212> DNA
<213> artificial
<220>
<223> spacerA-gRNA-F
<400> 17
ccgggagatc gagtgccgca tcac 24
<210> 18
<211> 24
<212> DNA
<213> artificial
<220>
<223> spacerA-gRNA-R
<400> 18
aaacgtgatg cggcactcga tctc 24
<210> 19
<211> 96
<212> DNA
<213> artificial
<220>
<223> spacerA-gRNA
<400> 19
gagatcgagt gccgcatcac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 20
<211> 24
<212> DNA
<213> artificial
<220>
<223> spacerK-gRNA-F
<400> 20
ccgggtcgcc ctcgaacttc acct 24
<210> 21
<211> 24
<212> DNA
<213> artificial
<220>
<223> spacerK-gRNA-R
<400> 21
aaacaggtga agttcgaggg cgac 24
<210> 22
<211> 96
<212> DNA
<213> artificial
<220>
<223> spacerK-gRNA
<400> 22
gtcgccctcg aacttcacct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 23
<211> 65
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegA-F
<400> 23
aaagtggcac cgagtcggtg cagcaagagc acaagaggaa gagagagacc ctcactatgc 60
ggcac 65
<210> 24
<211> 62
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegA-R
<400> 24
acagctatga ccatgattac gccaagctta aaaaaaatcg agtgccgcat agtgagggtc 60
tc 62
<210> 25
<211> 144
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegA
<400> 25
gagatcgagt gccgcatcac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagca agagcacaag aggaagagag 120
agaccctcac tatgcggcac tcga 144
<210> 26
<211> 56
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegK-F
<400> 26
aaagtggcac cgagtcggtg ctggtggggg actgagtgtg gcagggactc cccagc 56
<210> 27
<211> 60
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegK-R
<400> 27
gaccatgatt acgccaagct taaaaaaaac cctcgaactt cagctgggga gtccctgcca 60
<210> 28
<211> 144
<212> DNA
<213> artificial
<220>
<223> Gapdh-pegK
<400> 28
gtcgccctcg aacttcacct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctggt gggggactga gtgtggcagg 120
gactccccag ctgaagttcg aggg 144
<210> 29
<211> 62
<212> DNA
<213> artificial
<220>
<223> Actb-pegA-F
<400> 29
aaagtggcac cgagtcggtg ccagtcggtt ggagcgagca tcccccaaag ttcacaatgc 60
gg 62
<210> 30
<211> 66
<212> DNA
<213> artificial
<220>
<223> Actb-pegA-R
<400> 30
acagctatga ccatgattac gccaagctta aaaaaaatcg agtgccgcat tgtgaacttt 60
ggggga 66
<210> 31
<211> 144
<212> DNA
<213> artificial
<220>
<223> Actb-pegA
<400> 31
gagatcgagt gccgcatcac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgccagt cggttggagc gagcatcccc 120
caaagttcac aatgcggcac tcga 144
<210> 32
<211> 66
<212> DNA
<213> artificial
<220>
<223> Actb-pegK-F
<400> 32
aaagtggcac cgagtcggtg caaacaacaa tgtgcaatca aagtcctcgg ccacattgaa 60
gttcga 66
<210> 33
<211> 63
<212> DNA
<213> artificial
<220>
<223> Actb-pegK-R
<400> 33
acagctatga ccatgattac gccaagctta aaaaaaaccc tcgaacttca atgtggccga 60
gga 63
<210> 34
<211> 144
<212> DNA
<213> artificial
<220>
<223> Actb-pegK
<400> 34
gtcgccctcg aacttcacct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaac aacaatgtgc aatcaaagtc 120
ctcggccaca ttgaagttcg aggg 144
<210> 35
<211> 60
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegRNA-F
<400> 35
aagtggcacc gagtcggtgc tttacagcct ggcctttgga gatcgagtgc cgcatgggtc 60
<210> 36
<211> 65
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegRNA-R
<400> 36
aacagctatg accatgatta cgccaagctt aaaaaaaatt gacccgaccc atgcggcact 60
cgatc 65
<210> 37
<211> 143
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegRNA
<400> 37
tagcgttgac ccgaccccaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttta cagcctggcc tttggagatc 120
gagtgccgca tgggtcgggt caa 143
<210> 38
<211> 61
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegRNA-F
<400> 38
aagtggcacc gagtcggtgc gttactcccg ggcctcacgt cgccctcgaa cttcatttgc 60
a 61
<210> 39
<211> 68
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegRNA-R
<400> 39
aacagctatg accatgatta cgccaagctt aaaaaaaagc acacgtgcaa atgaagttcg 60
agggcgac 68
<210> 40
<211> 144
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegRNA
<400> 40
gtaagcacac gtgcaaagtg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgtta ctcccgggcc tcacgtcgcc 120
ctcgaacttc atttgcacgt gtgc 144
<210> 41
<211> 59
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegA-F
<400> 41
aagtggcacc gagtcggtgc gcccttcccc tgccagccta gcgttgaccc gacccatgc 59
<210> 42
<211> 67
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegA-R
<400> 42
acagctatga ccatgattac gccaagctta aaaaaaatcg agtgccgcat gggtcgggtc 60
aacgcta 67
<210> 43
<211> 144
<212> DNA
<213> artificial
<220>
<223> GapdhRC-pegA
<400> 43
gagatcgagt gccgcatcac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgccc ttcccctgcc agcctagcgt 120
tgacccgacc catgcggcac tcga 144
<210> 44
<211> 60
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegK-F
<400> 44
aagtggcacc gagtcggtgc tacttttgtc tccactaggt aagcacacgt gcaaatgaag 60
<210> 45
<211> 71
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegK-R
<400> 45
aacagctatg accatgatta cgccaagctt aaaaaaaacc ctcgaacttc atttgcacgt 60
gtgcttacct a 71
<210> 46
<211> 144
<212> DNA
<213> artificial
<220>
<223> GapdhRT-pegK
<400> 46
gtcgccctcg aacttcacct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctact tttgtctcca ctaggtaagc 120
acacgtgcaa atgaagttcg aggg 144
<210> 47
<211> 1447
<212> DNA
<213> artificial
<220>
<223> IRES-EGFP
<400> 47
ccggtgatgc ggcactcgat ctcgaattcc ccctctccct cccccccccc taacgttact 60
ggccgaagcc gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata 120
ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt 180
cctaggggtc tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa 240
gcagttcctc tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag 300
cggaaccccc cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca 360
cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc 420
aaatggctct cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat 480
tgtatgggat ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta 540
aaaaaacgtc taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga 600
taatatggcc acaacgctcg gtttaaaaag cttctatgcc tgaataggtg accggaggtc 660
ggcacctttc ctttgcaatt actgacccta tgaatacagg atctatggtg agcaagggcg 720
aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc 780
acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga 840
agttcatctg cactacgggg aaactgcccg tgccctggcc caccctcgtg accaccctga 900
cctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca 960
agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca 1020
actacaagac ccgcgctgaa gtcaaattcg agggcgacac cctggtgaac cgcatcgagc 1080
tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact 1140
acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact 1200
tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga 1260
acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt 1320
ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga 1380
ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaagtcgcc ctcgaacttc 1440
acctcgg 1447
<210> 48
<211> 4259
<212> DNA
<213> artificial
<220>
<223> 含T2A-EGFP的基因片段
<400> 48
ccggtgatgc ggcactcgat ctccaaaggc caggctgtaa atgtcaccgg gaggattggg 60
tgtctgggcg cctcggggaa cctgcccttc tccccattcc gtcttccgga aaccagatct 120
cccaccgcac cctggtctga ggttaaatat agctgctgac ctttctgtag ctgggggcct 180
gggctggggc tctctcccat cccttctccc cacacacatg cacttacctg tgctcccact 240
cctgatttct ggaaaagagc taggaaggac aggcaacttg gcaaatcaaa gccctgggac 300
tagggggtta aaatacagct tcccctcttc ccacccgccc cagtctctgt cccttttgta 360
ggagggactt agagaagggg tgggcttgcc ctgtccagtt aatttctgac ctttactcct 420
gccctttgag tttgatgatg ctgagtgtac aagcgttttc tccctaaagg gtgcagctga 480
gctaggcagc agcaagcatt cctggggtgg catagtgggg tggtgaatac catgtacaaa 540
gcttgtgccc agactgtggg tggcagtgcc ccacatggcc gcttctcctg gaagggcttc 600
gtatgactgg gggtgttggg cagccctgga gccttcagtt gcagccatgc cttaagccag 660
gccagcctgg cagggaagct caagggagat aaaattcaac ctcttgggcc ctcctggggg 720
taaggagatg ctgcattcgc cctcttaatg gggaggtggc ctagggctgc tcacatattc 780
tggaggagcc tcccctcctc atgccttctt gcctcttgtc tcttagattt ggtcgtattg 840
ggcgcctggt caccagggct gcttttaact ctggtaaagt ggatattgtt gccatcaatg 900
accccttcat tgacctcaac tacatggtga gtgctacatg gtgagcccca aagctggtgt 960
gggaggagcc acctggctga tgggcagccc cttcataccc tcacgtattc ccccaggttt 1020
acatgttcca atatgattcc acccatggca aattccatgg caccgtcaag gctgagaacg 1080
ggaagcttgt catcaatgga aatcccatca ccatcttcca ggagtgagtg gaagacagaa 1140
tggaagaaat gtgctttggg gaggcaacta ggatggtgtg gctcccttgg gtatatggta 1200
accttgtgtc cctcaatatg gtcctgtccc catctccccc ccacccccat aggcgagatc 1260
cctccaaaat caagtggggc gatgctggcg ctgagtacgt cgtggagtcc actggcgtct 1320
tcaccaccat ggagaaggct ggggtgagtg caggagggcc cgcgggaggg gaagctgact 1380
cagccctgca aaggcaggac ccgggttcat aactgtctgc ttctctgctg taggctcatt 1440
tgcagggggg agccaaaagg gtcatcatct ctgccccctc tgctgatgcc cccatgttcg 1500
tcatgggtgt gaaccatgag aagtatgaca acagcctcaa gatcatcagg tgaggaaggc 1560
agggcccgtg gagaagcggc cagcctggca ccctatggac acgctcccct gacttgcgcc 1620
ccgctccctc tttctttgca gcaatgcctc ctgcaccacc aactgcttag cacccctggc 1680
caaggtcatc catgacaact ttggtatcgt ggaaggactc atggtatgag agctggggaa 1740
tgggactgag gctcccacct ttctcatcca agactggctc ctccctgccg gggctgcgtg 1800
caaccctggg gttgggggtt ctggggactg gctttcccat aatttccttt caaggtgggg 1860
agggaggtag aggggtgatg tggggagtac gctgcagggc ctcactcctt ttgcagacca 1920
cagtccatgc catcactgcc acccagaaga ctgtggatgg cccctccggg aaactgtggc 1980
gtgatggccg cggggctctc cagaacatca tccctgcctc tactggcgct gccaaggctg 2040
tgggcaaggt catccctgag ctgaacggga agctcactgg catggccttc cgtgtcccca 2100
ctgccaacgt gtcagtggtg gacctgacct gccgtctaga aaaacctgcc aaatatgatg 2160
acatcaagaa ggtggtgaag caggcgtcgg agggccccct caagggcatc ctgggctaca 2220
ctgagcacca ggtggtctcc tctgacttca acagcgacac ccactcctcc acctttgacg 2280
ctggggctgg cattgccctc aacgaccact ttgtcaagct catttcctgg tatgtggctg 2340
gggccagaga ctggctctta aaaagtgcag ggtctggcgc cctctggtgg ctggctcaga 2400
aaaagggccc tgacaactct tttcatcttc taggtatgac aacgaatttg gctacagcaa 2460
cagggtggtg gacctcatgg cccacatggc ctccaaggag gagggcagag gaagtcttct 2520
aacatgcggt gacgtggagg agaatcccgg cccaatggtg agcaagggcg aggagctgtt 2580
caccggggtg gtgcccatcc tggtcgaact cgatggagat gtgaacggcc acaagttcag 2640
cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga agttcatctg 2700
cactacgggg aaactgcccg tgccctggcc caccctcgtg accaccctga cctacggcgt 2760
gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca agtccgccat 2820
gccagaggga tatgtgcaag agcgcaccat cttcttcaag gacgacggca actacaagac 2880
ccgcgctgaa gtcaaattcg agggcgacac cctggtgaac cgcatcgagc tgaagggcat 2940
cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact acaacagcca 3000
caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact tcaagatccg 3060
ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga acacccccat 3120
cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt ccgccctgag 3180
caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg 3240
gatcactctc ggcatggacg agctgtacaa gtaagacccc tggaccacca gccccagcaa 3300
gagcacaaga ggaagagaga gaccctcact gctggggagt ccctgccaca ctcagtcccc 3360
caccacactg aatctcccct cctcacagtt gccatgtaga ccccttgaag aggggagggg 3420
cctagggagc cgcaccttgt catgtaccat caataaagta ccctgtgctc aaccagttac 3480
ttgtcctgtc ttattctagg gtctggggca gaggggaggg aagctgggct tgtgtcaagg 3540
tgagacattc ttgctgggga gggacctggt atgttctcct cagactgagg gtagggcctc 3600
caaacagcct tgcttgcttc gagaaccatt tgcttcccgc tcagacgtct tgagtgctac 3660
aggaagctgg caccactact tcagagaaca aggccttttc ctctcctcgc tccagtccta 3720
ggctatctgc tgttggccaa acatggaaga agctattctg tgggcagccc cagggaggct 3780
gacaggtgga ggaagtcagg gctcgcactg ggctctgacg ctgactggtt agtggagctc 3840
agcctggagc tgagctgcag cgggcaattc cagcttggcc tccgcagctg tgaggtcttg 3900
agcacgtgct ctattgcttt ctgtgccctc gtgtcttatc tgaggacatc gtggccagcc 3960
cctaaggtct tcaagcagga ttcatctagg taaaccaagt acctaaaacc atgcccaagg 4020
cggtaaggac tatataatgt ttaaaaatcg gtaaaaatgc ccacctcgca tagttttgag 4080
gaagatgaac tgagatgtgt cagggtgact tatttccatc atcgtcctta ggggaacttg 4140
ggtaggggca aggcgtgtag ctgggaccta ggtccagacc cctggctctg ccactgaacg 4200
gctcagttgc tttgggcagt tactcccggg cctcacgtcg ccctcgaact tcacctcgg 4259
<210> 49
<211> 23
<212> DNA
<213> artificial
<220>
<223> SpacerA
<400> 49
gagatcgagt gccgcatcac cgg 23
<210> 50
<211> 23
<212> DNA
<213> artificial
<220>
<223> SpacerK
<400> 50
gtcgccctcg aacttcacct cgg 23
<210> 51
<211> 10
<212> PRT
<213> artificial
<220>
<223> 接头
<400> 51
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly
1 5 10
<210> 52
<211> 2099
<212> PRT
<213> artificial
<220>
<223> 融合蛋白
<400> 52
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
1370 1375 1380
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly
1385 1390 1395
Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu
1400 1405 1410
Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser
1415 1420 1425
Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala
1430 1435 1440
Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr
1445 1450 1455
Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
1460 1465 1470
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
1475 1480 1485
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
1490 1495 1500
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu
1505 1510 1515
Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro
1520 1525 1530
Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr
1535 1540 1545
Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
1550 1555 1560
Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
1565 1570 1575
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
1580 1585 1590
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
1595 1600 1605
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr
1610 1615 1620
Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
1625 1630 1635
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr
1640 1645 1650
Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys
1655 1660 1665
Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu
1670 1675 1680
Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro
1685 1690 1695
Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
1700 1705 1710
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
1715 1720 1725
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
1730 1735 1740
Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu
1745 1750 1755
Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu
1760 1765 1770
Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro
1775 1780 1785
Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
1790 1795 1800
Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
1805 1810 1815
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
1820 1825 1830
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
1835 1840 1845
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala
1850 1855 1860
Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
1865 1870 1875
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln
1880 1885 1890
His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro
1895 1900 1905
Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr
1910 1915 1920
Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly
1925 1930 1935
Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu
1940 1945 1950
Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr
1955 1960 1965
Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr
1970 1975 1980
Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile
1985 1990 1995
Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys
2000 2005 2010
Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro
2015 2020 2025
Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly His
2030 2035 2040
Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg
2045 2050 2055
Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
2060 2065 2070
Glu Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
2075 2080 2085
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
2090 2095
<210> 53
<211> 24
<212> DNA
<213> artificial
<220>
<223> sgACTB2-F
<400> 53
ccggccaccg caaatgcttc tagg 24
<210> 54
<211> 24
<212> DNA
<213> artificial
<220>
<223> sgACTB2-R
<400> 54
aaaccctaga agcatttgcg gtgg 24
<210> 55
<211> 96
<212> DNA
<213> artificial
<220>
<223> sgACTB2
<400> 55
ccaccgcaaa tgcttctagg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 56
<211> 24
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgL-F
<400> 56
ccgggagctg gacggcgacg taaa 24
<210> 57
<211> 24
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgL-R
<400> 57
aaactttacg tcgccgtcca gctc 24
<210> 58
<211> 96
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgL
<400> 58
gagctggacg gcgacgtaaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 59
<211> 24
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgR-F
<400> 59
ccggcatgcc cgaaggctac gtcc 24
<210> 60
<211> 24
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgR-R
<400> 60
aaacggacgt agccttcggg catg 24
<210> 61
<211> 96
<212> DNA
<213> artificial
<220>
<223> ACTB2-sgR
<400> 61
catgcccgaa ggctacgtcc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 62
<211> 60
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegL-F
<400> 62
aaagtggcac cgagtcggtg cggcccctcc atcgtccacc gcaaatgctt cacgtcgccg 60
<210> 63
<211> 60
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegL-R
<400> 63
aacagctatg accatgatta cgccaagctt aaaaaaaaga cggcgacgtg aagcatttgc 60
<210> 64
<211> 137
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegL
<400> 64
gagctggacg gcgacgtaaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcc cctccatcgt ccaccgcaaa 120
tgcttcacgt cgccgtc 137
<210> 65
<211> 58
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegR-F
<400> 65
aaagtggcac cgagtcggtg cggtgtaacg caactaagtc atagtccgcc tcgtagcc 58
<210> 66
<211> 63
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegR-R
<400> 66
aacagctatg accatgatta cgccaagctt aaaaaaaacg aaggctacga ggcggactat 60
gac 63
<210> 67
<211> 137
<212> DNA
<213> artificial
<220>
<223> ACTB2-pegR
<400> 67
catgcccgaa ggctacgtcc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggtg taacgcaact aagtcatagt 120
ccgcctcgta gccttcg 137
<210> 68
<211> 18
<212> DNA
<213> artificial
<220>
<223> GAPDH-P1
<400> 68
aaaagtgcag ggtctggc 18
<210> 69
<211> 20
<212> DNA
<213> artificial
<220>
<223> GAPDH-P2
<400> 69
acaccggcct tattccaagc 20
<210> 70
<211> 22
<212> DNA
<213> artificial
<220>
<223> GAPDH-P3
<400> 70
ccgaccacta ccagcagaac ac 22
<210> 71
<211> 25
<212> DNA
<213> artificial
<220>
<223> GAPDH-P4
<400> 71
ccagacccta gaataagaca ggaca 25
<210> 72
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB-P1
<400> 72
gggagctgtc acatccaggg tc 22
<210> 73
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB-P2
<400> 73
aagacggcaa tatggtggaa aa 22
<210> 74
<211> 20
<212> DNA
<213> artificial
<220>
<223> ACTB-P3
<400> 74
ctgcccgaca accactacct 20
<210> 75
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB-P4
<400> 75
ctaaggctgc tcaatgtcaa gg 22
<210> 76
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB2-P1
<400> 76
gggagctgtc acatccaggg tc 22
<210> 77
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB2-P2
<400> 77
catctccatc gagttcgacc ag 22
<210> 78
<211> 20
<212> DNA
<213> artificial
<220>
<223> ACTB2-P3
<400> 78
ctgcccgaca accactacct 20
<210> 79
<211> 22
<212> DNA
<213> artificial
<220>
<223> ACTB2-P4
<400> 79
ctaaggctgc tcaatgtcaa gg 22
<210> 80
<211> 23
<212> DNA
<213> artificial
<220>
<223> spacer L
<400> 80
gagctggacg gcgacgtaaa cgg 23
<210> 81
<211> 23
<212> DNA
<213> artificial
<220>
<223> spacer R
<400> 81
catgcccgaa ggctacgtcc agg 23
<210> 82
<211> 771
<212> DNA
<213> artificial
<220>
<223> T2A-EGFP
<400> 82
gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg cccagtgagc 60
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgaactcga tggagatgtg 120
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 180
accctgaagt tcatctgcac tacggggaaa ctgcccgtgc cctggcccac cctcgtgacc 240
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 300
ttcttcaagt ccgccatgcc agagggatat gtgcaagagc gcaccatctt cttcaaggac 360
gacggcaact acaagacccg cgctgaagtc aaattcgagg gcgacaccct ggtgaaccgc 420
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 480
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 540
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 600
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 660
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 720
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta a 771
<210> 83
<211> 800
<212> DNA
<213> artificial
<220>
<223> ACTB2 LHA
<400> 83
tggacctggc tggccgggac ctgactgact acctcatgaa gatcctcacc gagcgcggct 60
acagcttcac caccacggcc gagcgggaaa tcgtgcgtga cattaaggag aagctgtgct 120
acgtcgccct ggacttcgag caagagatgg ccacggctgc ttccagctcc tccctggaga 180
agagctacga gctgcctgac ggccaggtca tcaccattgg caatgagcgg ttccgctgcc 240
ctgaggcact cttccagcct tccttcctgg gtgagtggag actgtctccc ggctctgcct 300
gacatgaggg ttacccctcg gggctgtgct gtggaagcta agtcctgccc tcatttccct 360
ctcaggcatg gagtcctgtg gcatccacga aactaccttc aactccatca tgaagtgtga 420
cgtggacatc cgcaaagacc tgtacgccaa cacagtgctg tctggcggca ccaccatgta 480
ccctggcatt gccgacagga tgcagaagga gatcactgcc ctggcaccca gcacaatgaa 540
gatcaaggtg ggtgtctttc ctgcctgagc tgacctgggc aggtcggctg tggggtcctg 600
tggtgtgtgg ggagctgtca catccagggt cctcactgcc tgtccccttc cctcctcaga 660
tcattgctcc tcctgagcgc aagtactccg tgtggatcgg cggctccatc ctggcctcgc 720
tgtccacctt ccagcagatg tggatcagca agcaggagta tgacgagtcc ggcccctcca 780
tcgtccaccg caaatgcttc 800
<210> 84
<211> 800
<212> DNA
<213> artificial
<220>
<223> ACTB2 RHA
<400> 84
aggcggacta tgacttagtt gcgttacacc ctttcttgac aaaacctaac ttgcgcagaa 60
aacaagatga gattggcatg gctttatttg ttttttttgt tttgttttgg tttttttttt 120
ttttttggct tgactcagga tttaaaaact ggaacggtga aggtgacagc agtcggttgg 180
agcgagcatc ccccaaagtt cacaatgtgg ccgaggactt tgattgcaca ttgttgtttt 240
tttaatagtc attccaaata tgagatgcgt tgttacagga agtcccttgc catcctaaaa 300
gccaccccac ttctctctaa ggagaatggc ccagtcctct cccaagtcca cacaggggag 360
gtgatagcat tgctttcgtg taaattatgt aatgcaaaat ttttttaatc ttcgccttaa 420
tactttttta ttttgtttta ttttgaatga tgagccttcg tgccccccct tccccctttt 480
ttgtccccca acttgagatg tatgaaggct tttggtctcc ctgggagtgg gtggaggcag 540
ccagggctta cctgtacact gacttgagac cagttgaata aaagtgcaca ccttaaaaat 600
gaggccaagt gtgactttgt ggtgtggctg ggttgggggc agcagagggt gaaccctgca 660
ggagggtgaa ccctgcaaaa gggtggggca gtgggggcca acttgtcctt acccagagtg 720
caggtgtgtg gagatccctc ctgccttgac attgagcagc cttagagggt gggggaggct 780
caggggtcag gtctctgttc 800

Claims (66)

1.一种系统或试剂盒,其包含下述四种组分:
(1)第一Cas蛋白或含有编码所述第一Cas蛋白的核苷酸序列的核酸分子A1,其中,所述第一Cas蛋白能够切割或断裂第一双链靶核酸;
(2)依赖于模板的第一DNA聚合酶或含有编码所述第一DNA聚合酶的核苷酸序列的核酸分子B1;
(3)第一gRNA或含有编码所述第一gRNA的核苷酸序列的核酸分子C1,其中,所述第一gRNA能够与所述第一Cas蛋白结合,并形成第一功能性复合物;所述第一功能性复合物能够将第一双链靶核酸的两条链断裂,形成断裂的靶核酸片段;
(4)第一标签引物或含有编码所述第一标签引物的核苷酸序列的核酸分子D1,其中,所述第一标签引物含有第一标签序列和第一靶结合序列,所述第一标签序列位于所述第一靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述第一标签序列不与所述靶核酸片段结合,处于游离的单链状态。
2.权利要求1的系统或试剂盒,其中,所述第一Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第一Cas蛋白能够断裂第一双链靶核酸,并产生粘末端或平末端;
优选地,所述第一Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第一Cas蛋白具有SEQ ID NO:1示的氨基酸序列。
3.权利要求1或2的系统或试剂盒,其中,所述第一DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第一DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第一DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列。
4.权利要求1-3任一项的系统或试剂盒,其中,所述第一Cas蛋白与所述第一DNA聚合酶相连接;
优选地,所述第一Cas蛋白通过接头或者不通过接头与所述第一DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第一Cas蛋白通过肽接头或者不通过肽接头与所述第一DNA聚合酶融合,形成第一融合蛋白;
优选地,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的N端;或者,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的C端;
优选地,所述第一融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
5.权利要求1-4任一项的系统或试剂盒,其中,所述第一gRNA含有第一引导序列,并且,在允许核酸杂交或退火的条件下,所述第一引导序列能够杂交或退火至第一双链靶核酸的一条核酸链;
优选地,所述第一引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一gRNA还含有第一支架序列,其能够被所述第一Cas蛋白识别并结合,从而形成第一功能性复合物;
优选地,所述第一支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一引导序列位于所述第一支架序列的上游或5’端;
优选地,所述第一功能性复合物在所述第一引导序列与第一双链靶核酸结合后,能够将第一双链靶核酸的两条链断裂。
6.权利要求1-5任一项的系统或试剂盒,其中,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,并且所述3’端是因所述第一功能性复合物断裂所述第一双链靶核酸而形成的;
优选地,所述第一靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,在所述第一靶结合序列杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端后,所述第一DNA聚合酶能够以第一标签引物为模板,延伸所述核酸链的3’端;优选地,所述延伸形成第一悬突;
优选地,所述第一标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第一标签引物为单链核糖核酸,并且所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第一标签引物为单链脱氧核糖核酸,并且所述第一DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述第一引导序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的;优选地,所述第一引导序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链。
7.权利要求1-6任一项的系统或试剂盒,其中,所述第一标签引物与所述第一gRNA相连接;
优选地,所述第一标签引物通过接头或者不通过接头与所述第一gRNA共价相连接;
优选地,所述第一标签引物任选地通过接头连接至所述第一gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第一标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第一gRNA的3’端相连接,形成第一PegRNA。
8.权利要求1-7任一项的系统或试剂盒,其具有选自下列的一项或多项技术特征:
(1)所述核酸分子A1能够在细胞中表达所述第一Cas蛋白;
(2)所述核酸分子B1能够在细胞中表达所述第一DNA聚合酶;
(3)所述核酸分子C1能够在细胞中转录出所述第一gRNA;
(4)所述核酸分子D1能够在细胞中转录出所述第一标签引物;
优选地,所述核酸分子A1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A1为含有编码所述第一Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体);
优选地,所述核酸分子B1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B1为含有编码所述第一DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体);
优选地,所述核酸分子C1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C1为含有编码所述第一gRNA的核苷酸序列的表达载体(例如,真核表达载体);
优选地,所述核酸分子D1包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D1为含有编码所述第一标签引物的核苷酸序列的表达载体(例如,真核表达载体);
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;
优选地,所述核酸分子A1、B1、C1和D1中的两个、三个或四个包含于相同的表达载体(例如,真核表达载体)中。
9.权利要求1-8任一项的系统或试剂盒,其中,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;和,
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子。
10.权利要求1-9任一项的系统或试剂盒,其中,所述系统或试剂盒还包含:
(5)第二gRNA或含有编码所述第二gRNA的核苷酸序列的核酸分子C2,其中,所述第二gRNA能够与第二Cas蛋白结合,并形成第二功能性复合物;所述第二功能性复合物能够将第二双链靶核酸的两条链断裂,形成断裂的靶核酸片段;
优选地,所述第二Cas蛋白与所述第一Cas蛋白相同或者不同;优选地,所述第二Cas蛋白与所述第一Cas蛋白相同;
优选地,所述第二gRNA含有第二引导序列,并且,在允许核酸杂交或退火的条件下,所述第二引导序列能够杂交或退火到第二双链靶核酸的一条核酸链;
优选地,所述第二功能性复合物在所述第二引导序列与第二双链靶核酸结合后,将第二双链靶核酸的两条链断裂;
优选地,所述第二引导序列与所述第一引导序列不同;
优选地,所述第二双链靶核酸与所述第一双链靶核酸相同或者不同;
优选地,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第二功能性复合物与所述第一功能性复合物在不同的位置断裂所述相同的双链靶核酸;
优选地,所述第二功能性复合物与所述第一功能性复合物断裂相同的双链靶核酸,并且,所述第一引导序列结合的核酸链与所述第二引导序列结合的核酸链是不同的;优选地,所述第一引导序列结合的核酸链是所述第二引导序列结合的核酸链的相对链;
优选地,所述第二引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二gRNA还含有第二支架序列,其能够被所述第二Cas蛋白识别并结合,从而形成第二功能性复合物;
优选地,所述第二支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二支架序列与所述第一支架序列相同或者不同;优选地,所述第二支架序列与所述第一支架序列相同;
优选地,所述第二引导序列位于所述第二支架序列的上游或5’端;
优选地,所述核酸分子C2能够在细胞中转录出所述第二gRNA;
优选地,所述核酸分子C2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C2为含有编码所述第二gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
11.权利要求10的系统或试剂盒,其中,所述第二Cas蛋白与所述第一Cas蛋白不同;并且,所述系统或试剂盒还包含:
(6)所述第二Cas蛋白或含有编码所述第二Cas蛋白的核苷酸序列的核酸分子A2,其中,所述第二Cas蛋白能够切割或断裂第二双链靶核酸;
优选地,所述第二Cas蛋白能够断裂第二双链靶核酸,并产生粘末端或平末端;
优选地,所述第二Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第二Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第二Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述核酸分子A2能够在细胞中表达所述第二Cas蛋白;
优选地,所述核酸分子A2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A2为含有编码所述第二Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
12.权利要求1-11任一项的系统或试剂盒,其中,所述系统或试剂盒还包含:
(7)第二标签引物或含有编码所述第二标签引物的核苷酸序列的核酸分子D2,其中,所述第二标签引物含有第二标签序列和第二靶结合序列,所述第二标签序列位于所述第二靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述第二标签序列不与所述靶核酸片段结合,处于游离的单链状态;
优选地,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,并且所述3’端是因所述第二功能性复合物断裂第二双链靶核酸而形成的;
优选地,所述第二靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二靶结合序列与所述第一靶结合序列不同;优选地,所述第二靶结合序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的;优选地,所述第二靶结合序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链;
优选地,所述第二标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二标签序列与所述第一标签序列相同或不同;优选地,所述第二标签序列与所述第一标签序列不同;
优选地,在所述第二靶结合序列杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端后,第二DNA聚合酶能够以第二标签引物为模板,延伸所述核酸链的3’端;优选地,所述延伸形成第二悬突;
优选地,所述第二DNA聚合酶与所述第一DNA聚合酶相同或者不同;优选地,所述第二DNA聚合酶与所述第一DNA聚合酶相同;
优选地,所述第二标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第二标签引物为单链核糖核酸,并且所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第二标签引物为单链脱氧核糖核酸,并且所述第二DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述第二引导序列结合的核酸链与所述第二靶结合序列结合的核酸链是不同的;优选地,所述第二引导序列结合的核酸链是所述第二靶结合序列结合的核酸链的相对链;
优选地,所述第二引导序列与所述第一靶结合序列结合相同的核酸链,并且,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的上游或5’端;
优选地,所述第一引导序列与所述第二靶结合序列结合相同的核酸链,并且,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的上游或5’端;
优选地,所述第一悬突和第二悬突包含于相同的靶核酸片段上,且彼此位于相对的核酸链上;
优选地,所述核酸分子D2能够在细胞中转录出所述第二标签引物;
优选地,所述核酸分子D2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D2为含有编码所述第二标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
13.权利要求12的系统或试剂盒,其中,所述第二DNA聚合酶与所述第一DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(8)所述第二DNA聚合酶或含有编码所述第二DNA聚合酶的核苷酸序列的核酸分子B2;
优选地,所述第二DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第二DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第二DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述核酸分子B2能够在细胞中表达所述第二DNA聚合酶;
优选地,所述核酸分子B2包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B2为含有编码所述第二DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
14.权利要求12或13的系统或试剂盒,其中,所述第二标签引物与所述第二gRNA相连接;
优选地,所述第二标签引物通过接头或者不通过接头与所述第二gRNA共价相连接;
优选地,所述第二标签引物任选地通过接头连接至所述第二gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第二标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第二gRNA的3’端相连接,形成第二PegRNA;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;
优选地,所述系统或试剂盒包含:含有所述第二gRNA和所述第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子。
15.权利要求13或14的系统或试剂盒,其中,所述第二Cas蛋白与所述第二DNA聚合酶是分离的或者相连接的;
优选地,所述第二Cas蛋白通过接头或者不通过接头与所述第二DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第二Cas蛋白通过肽接头或者不通过肽接头与所述第二DNA聚合酶融合,形成第二融合蛋白;
优选地,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的N端;或者,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的C端;
优选地,所述第二融合蛋白具有SEQ ID NO:52所示的氨基酸序列;
优选地,所述核酸分子A2和核酸分子B2包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A2和核酸分子B2在细胞中能够表达分离的所述第二Cas蛋白和所述第二DNA聚合酶,或者能够表达含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白;
优选地,所述系统或试剂盒包含,含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白,或者,含有编码所述第二融合蛋白的核苷酸序列的核酸分子;或者,分离的所述第二Cas蛋白和第二DNA聚合酶,或者,能够表达分离的所述第二Cas蛋白和第二DNA聚合酶的核酸分子;
优选地,所述第一和第二Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子。
16.权利要求1-15任一项的系统或试剂盒,其中,所述系统或试剂盒还包含核酸载体;
优选地,所述核酸载体是双链的;
优选地,所述核酸载体是环状双链载体;
优选地,所述核酸载体包含能够与所述第一引导序列杂交或退火的第一引导结合序列(例如,所述第一引导序列的互补序列),和/或,能够与所述第二引导序列杂交或退火的第二引导结合序列(例如,所述第二引导序列的互补序列);任选地,所述核酸载体在所述第一引导结合序列与所述第二引导结合序列之间还包含限制性酶切位点;
优选地,所述第一引导结合序列与所述第二引导结合序列位于所述核酸载体的相对链上;
优选地,所述核酸载体还包含所述第一Cas蛋白识别的第一PAM序列,和/或,所述第二Cas蛋白识别的第二PAM序列;
优选地,所述第一功能性复合物能够通过所述第一引导结合序列和所述第一PAM序列,结合并断裂所述核酸载体;和/或,所述第二功能性复合物能够通过所述第二引导结合序列和所述第二PAM序列,结合并断裂所述核酸载体。
17.权利要求16的系统或试剂盒,其中,所述核酸载体还包含目的基因;
优选地,所述目的基因位于所述第一引导结合序列与所述第二引导结合序列之间;
优选地,所述第一功能性复合物和所述第二功能性复合物断裂所述核酸载体,导致产生含有目的基因的核酸片段;
优选地,在允许核酸杂交或退火的条件下,所述第一标签引物能够通过所述第一靶结合序列与所述核酸片段的一条核酸链的3’端杂交或退火,形成双链结构,并且,所述第一标签引物的所述第一标签序列处于游离状态;优选地,所述第一靶结合序列杂交或退火的核酸链是含有所述第一引导结合序列的核酸链的相对链;
优选地,在允许核酸杂交或退火的条件下,所述第二标签引物能够通过所述第二靶结合序列与所述核酸片段的一条核酸链的3’端杂交或退火,形成双链结构,并且,所述第二标签引物的所述第二标签序列处于游离状态;优选地,所述第二靶结合序列杂交或退火的核酸链是含有所述第二引导结合序列的核酸链的相对链;
优选地,所述第一靶结合序列杂交或退火的核酸链是所述第二靶结合序列杂交或退火的核酸链的相对链。
18.权利要求16或17的系统或试剂盒,其中,所述核酸载体还包含第一靶序列;其中,在允许核酸杂交或退火的条件下,所述第一标签引物能够通过所述第一靶结合序列与所述第一靶序列杂交或退火,形成双链结构,并且,所述第一标签引物的所述第一标签序列处于游离状态;优选地,所述第一靶序列位于所述第一引导结合序列与所述第二引导结合序列之间;优选地,所述第一靶序列位于所述第一引导结合序列的相对链;优选地,在所述第一功能性复合物断裂所述核酸载体后,含有第一靶序列的核酸链能够以退火至第一靶序列的第一标签引物为模板进行延伸(优选地,形成第一悬突);优选地,所述第一功能性复合物断裂所述核酸载体的位点位于所述第一靶序列的3’末端或者3’部分;优选地,所述第一靶序列位于所述含有目的基因的核酸片段的一条核酸链的3’末端;
和/或,
所述核酸载体还包含第二靶序列;其中,在允许核酸杂交或退火的条件下,所述第二标签引物能够通过所述第二靶结合序列与所述第二靶序列杂交或退火,形成双链结构,并且,所述第二标签引物的所述第二标签序列处于游离状态;优选地,所述第二靶序列位于所述第一引导结合序列与所述第二引导结合序列之间;优选地,所述第二靶序列位于所述第二引导结合序列的相对链;优选地,在所述第二功能性复合物断裂所述核酸载体后,含有第二靶序列的核酸链能够以退火至第二靶序列的第二标签引物为模板进行延伸(优选地,形成第二悬突);优选地,所述第二功能性复合物断裂所述核酸载体的位点位于所述第二靶序列的3’末端或者3’部分;优选地,所述第二靶序列位于所述含有目的基因的核酸片段的一条核酸链的3’末端;
优选地,含有第一靶序列的核酸链位于含有第二靶序列的核酸链的相对链;
优选地,所述核酸载体在所述第一靶序列与所述第二靶序列之间还包含限制性酶切位点;
优选地,所述核酸载体在所述第一靶序列与所述第二靶序列之间还包含目的基因。
19.权利要求1-18任一项的系统或试剂盒,其中,所述系统或试剂盒还包含:
(9)第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子C3,其中,所述第三gRNA能够与第三Cas蛋白结合,并形成第三功能性复合物;所述第三功能性复合物能够将第三双链靶核酸的两条链断裂,形成断裂的核苷酸片段a1和a2;
优选地,所述第三Cas蛋白与所述第一Cas蛋白或第二Cas蛋白相同或者不同;优选地,所述第一、第二和第三Cas蛋白是相同的Cas蛋白;
优选地,所述第三gRNA含有第三引导序列,并且,在允许核酸杂交或退火的条件下,所述第三引导序列能够杂交或退火到第三双链靶核酸的一条核酸链;
优选地,所述第三功能性复合物在所述第三引导序列与第三双链靶核酸结合后,将第三双链靶核酸的两条链断裂;
优选地,所述第三引导序列与所述第一引导序列或第二引导序列相同或者不同;优选地,所述第一、第二和第三引导序列彼此不同;
优选地,所述第三双链靶核酸与所述第一双链靶核酸或第二双链靶核酸相同或者不同;优选地,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第三双链靶核酸与所述第一和第二双链靶核酸是不同的;优选地,所述第三双链靶核酸为基因组DNA;
优选地,所述第三引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第三gRNA还含有第三支架序列,其能够被所述第三Cas蛋白识别并结合,从而形成第三功能性复合物;
优选地,所述第三支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第三支架序列与所述第一支架序列或第二支架序列相同或者不同;优选地,所述第一、第二和第三支架序列是相同的;
优选地,所述第三引导序列位于所述第三支架序列的上游或5’端;
优选地,所述核酸分子C3能够在细胞中转录出所述第三gRNA;
优选地,所述核酸分子C3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C3为含有编码所述第三gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
20.权利要求19的系统或试剂盒,其中,所述第三功能性复合物能够将第三双链靶核酸的两条链断裂,形成断裂的核苷酸片段a1和a2;
优选地,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火;
优选地,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火;
优选地,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的;
优选地,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’部分,且所述核苷酸片段a1的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第一间隔区域;
优选地,所述第一间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt;
优选地,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a2杂交或退火;
优选地,所述第二标签序列或其互补序列或所述第二悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a2杂交或退火;
优选地,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的;
优选地,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’部分,且所述核苷酸片段a2的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第二间隔区域。
优选地,所述第二间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt。
21.权利要求19或20的系统或试剂盒,其中,所述第三Cas蛋白与所述第一Cas蛋白或第二Cas蛋白不同;并且,所述系统或试剂盒还包含:
(10)所述第三Cas蛋白或含有编码所述第三Cas蛋白的核苷酸序列的核酸分子A3,其中,所述第三Cas蛋白能够切割或断裂第三双链靶核酸;
优选地,所述第三Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白,Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第三Cas蛋白能够断裂第三双链靶核酸,并产生粘末端或平末端;
优选地,所述第三Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第三Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述核酸分子A3能够在细胞中表达所述第三Cas蛋白;
优选地,所述核酸分子A3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A3为含有编码所述第三Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
22.权利要求19或20的系统或试剂盒,其中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)所述第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子;
优选地,所述系统或试剂盒还包含:权利要求16-18任一项中所定义的核酸载体。
23.权利要求19-22任一项所述的系统或试剂盒,其中,所述系统或试剂盒还包含:
(11)第三标签引物或含有编码所述第三标签引物的核苷酸序列的核酸分子D3,其中,所述第三标签引物含有第三标签序列和第三靶结合序列,所述第三标签序列位于所述第三靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第三靶结合序列能够杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端,形成双链结构,且,所述第三标签序列不与所述核苷酸片段a1或a2结合,处于游离的单链状态;
优选地,在允许核酸杂交或退火的条件下,所述第三靶结合序列能够杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端,并且所述3’端是因所述第三功能性复合物断裂第三双链靶核酸而形成的;
优选地,所述第三靶结合序列结合的核酸链与所述第三引导序列结合的核酸链是不同的;优选地,所述第三靶结合序列结合的核酸链是所述第三引导序列结合的核酸链的相对链;
优选地,所述第三靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第三靶结合序列与所述第一或第二靶结合序列不同;
优选地,在所述第三靶结合序列杂交或退火到所述断裂的核苷酸片段a1或a2的一条核酸链的3’端后,第三DNA聚合酶能够以第三标签引物为模板,延伸所述核酸链的3’端;优选地,所述延伸形成第三悬突;
优选地,所述第三标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第三标签序列与所述第一或第二标签序列相同或不同;优选地,所述第三标签序列与所述第一或第二标签序列不同;
优选地,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与含有第一悬突或者第二悬突的核酸链杂交或退火;优选地,所述第三标签序列的互补序列或所述第三悬突与所述第一悬突或者第二悬突或其上游核苷酸序列杂交或退火;
优选地,所述第三DNA聚合酶与所述第一或第二DNA聚合酶相同或者不同;优选地,所述第一、第二和第三DNA聚合酶是相同的DNA聚合酶;
优选地,所述第三标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第三标签引物为单链核糖核酸,并且所述第三DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第三标签引物为单链脱氧核糖核酸,并且所述第三DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述核酸分子D3能够在细胞中转录出所述第三标签引物;
优选地,所述核酸分子D3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D3为含有编码所述第三标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
24.权利要求23所述的系统或试剂盒,其中,所述第三DNA聚合酶与所述第一或第二DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(12)所述第三DNA聚合酶或含有编码所述第三DNA聚合酶的核苷酸序列的核酸分子B3;
优选地,所述第三DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第三DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第三DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第三DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述核酸分子B3能够在细胞中表达所述第三DNA聚合酶;
优选地,所述核酸分子B3包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B3为含有编码所述第三DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
25.权利要求23或24的系统或试剂盒,其中,所述第三标签引物与所述第三gRNA相连接;
优选地,所述第三标签引物通过接头或者不通过接头与所述第三gRNA共价相连接;
优选地,所述第三标签引物任选地通过接头连接至所述第三gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第三标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第三gRNA的3’端相连接,形成第三PegRNA;
优选地,所述核酸分子C3和核酸分子D3包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C3和核酸分子D3在细胞中能够转录出含有所述第三gRNA和所述第三标签引物的第三PegRNA;
优选地,所述系统或试剂盒包含:含有所述第三gRNA和所述第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子。
26.权利要求24或25的系统或试剂盒,其中,所述第三Cas蛋白与所述第三DNA聚合酶是分离的或者相连接的;
优选地,所述第三Cas蛋白通过接头或者不通过接头与所述第三DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第三Cas蛋白通过肽接头或者不通过肽接头与所述第三DNA聚合酶融合,形成第三融合蛋白;
优选地,所述第三Cas蛋白任选地通过接头连接或融合至所述第三DNA聚合酶的N端;或者,所述第三Cas蛋白任选地通过接头连接或融合至所述第三DNA聚合酶的C端;
优选地,所述第三融合蛋白具有SEQ ID NO:52所示的氨基酸序列;
优选地,所述核酸分子A3和核酸分子B3包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A3和核酸分子B3在细胞中能够表达分离的所述第三Cas蛋白和所述第三DNA聚合酶,或者能够表达含有所述第三Cas蛋白和所述第三DNA聚合酶的第三融合蛋白;
优选地,所述系统或试剂盒包含,含有所述第三Cas蛋白和所述第三DNA聚合酶的第三融合蛋白,或者,含有编码所述第三融合蛋白的核苷酸序列的核酸分子;或者,分离的所述第三Cas蛋白和第三DNA聚合酶,或者,能够表达分离的所述第三Cas蛋白和第三DNA聚合酶的核酸分子。
27.权利要求23或25的系统或试剂盒,其中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,所述第一、第二和第三DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)含有所述第三gRNA和第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子;
优选地,所述系统或试剂盒还包含:权利要求16-18任一项中所定义的核酸载体。
28.权利要求1-27任一项的系统或试剂盒,其中,所述系统或试剂盒还包含:
(13)第四gRNA或含有编码所述第四gRNA的核苷酸序列的核酸分子C4,其中,所述第四gRNA能够与第四Cas蛋白结合,并形成第四功能性复合物;所述第四功能性复合物能够将第四双链靶核酸的两条链断裂,形成断裂的靶核酸片段b1和b2;
优选地,所述第四Cas蛋白与所述第一、第二或第三Cas蛋白相同或者不同;优选地,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白;
优选地,所述第四gRNA含有第四引导序列,并且,在允许核酸杂交或退火的条件下,所述第四引导序列能够杂交或退火到第四双链靶核酸的一条核酸链;
优选地,所述第四功能性复合物在所述第四引导序列与第四双链靶核酸结合后,将第四双链靶核酸的两条链断裂;
优选地,所述第四引导序列与所述第一、第二或第三引导序列相同或者不同;优选地,所述第一、第二、第三和第四引导序列彼此不同;
优选地,所述第四双链靶核酸与所述第一、第二或第三双链靶核酸相同或者不同;优选地,所述第二双链靶核酸与所述第一双链靶核酸是相同的,并且,所述第四双链靶核酸与所述第三双链靶核酸是相同的,但与第一或第二双链靶核酸不同;优选地,所述第四功能性复合物与所述第三功能性复合物在不同的位置断裂所述相同的双链靶核酸;
优选地,所述第四功能性复合物与所述第三功能性复合物断裂相同的双链靶核酸,并且,所述第四引导序列结合的核酸链与所述第三引导序列结合的核酸链是不同的;优选地,所述第四引导序列结合的核酸链是所述第三引导序列结合的核酸链的相对链;
优选地,所述第四双链靶核酸为基因组DNA;
优选地,所述第四引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第四gRNA还含有第四支架序列,其能够被所述第四Cas蛋白识别并结合,从而形成第四功能性复合物;
优选地,所述第四支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第四支架序列与所述第一、第二或第三支架序列相同或者不同;优选地,所述第一、第二、第三和第四支架序列是相同的;
优选地,所述第四引导序列位于所述第四支架序列的上游或5’端;
优选地,所述核酸分子C4能够在细胞中转录出所述第四gRNA;
优选地,所述核酸分子C4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子C4为含有编码所述第四gRNA的核苷酸序列的表达载体(例如,真核表达载体)。
29.权利要求28的系统或试剂盒,其中,所述第四双链靶核酸与所述第三双链靶核酸是相同的,并且,所述第三和第四功能性复合物在不同的位置断裂所述相同的双链靶核酸,形成断裂的核苷酸片段a1、a2和a3;其中,在断裂之前,在所述相同的双链靶核酸中,核苷酸片段a1、a2和a3依次排列(即,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连);优选地,所述第三和第四功能性复合物分别导致核苷酸片段a1和a2的分离以及核苷酸片段a2和a3的分离;
优选地,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火;优选地,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火;优选地,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的;
优选地,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a3杂交或退火;优选地,所述第二标签序列或其互补序列或所述第二悬突能够在第四功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a3杂交或退火;优选地,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述第三双链靶核酸而形成的。
30.权利要求28或29的系统或试剂盒,其中,所述第四Cas蛋白与所述第一、第二或第三Cas蛋白不同;并且,所述系统或试剂盒还包含:
(14)所述第四Cas蛋白或含有编码所述第四Cas蛋白的核苷酸序列的核酸分子A4,其中,所述第四Cas蛋白能够切割或断裂第四双链靶核酸;
优选地,所述第四Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白,Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第四Cas蛋白能够断裂第四双链靶核酸,并产生粘末端或平末端;
优选地,所述第四Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第四Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述核酸分子A4能够在细胞中表达所述第四Cas蛋白;
优选地,所述核酸分子A4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子A4为含有编码所述第四Cas蛋白的核苷酸序列的表达载体(例如,真核表达载体)。
31.权利要求28或29的系统或试剂盒,其中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,所述第一和第二DNA聚合酶(以及任选的第三DNA聚合酶)是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)所述第三gRNA或含有编码所述第三gRNA的核苷酸序列的核酸分子;或者,含有所述第三gRNA和第三标签引物的第三PegRNA,或,含有编码所述第三PegRNA的核苷酸序列的核酸分子;
(M5)所述第四gRNA或含有编码所述第四gRNA的核苷酸序列的核酸分子;
优选地,所述系统或试剂盒还包含:权利要求16-18任一项中所定义的核酸载体。
32.权利要求28-31任一项所述的系统或试剂盒,其中,所述系统或试剂盒还包含:
(15)第四标签引物或含有编码所述第四标签引物的核苷酸序列的核酸分子D4,其中,所述第四标签引物含有第四标签序列和第四靶结合序列,所述第四标签序列位于所述第四靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第四靶结合序列能够杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端,形成双链结构,且,所述第四标签序列不与所述靶核酸片段b1或b2结合,处于游离的单链状态;
优选地,在允许核酸杂交或退火的条件下,所述第四靶结合序列能够杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端,并且所述3’端是因所述第四功能性复合物断裂第四双链靶核酸而形成的;
优选地,所述第四靶结合序列结合的核酸链与所述第四引导序列结合的核酸链是不同的;优选地,所述第四靶结合序列结合的核酸链是所述第四引导序列结合的核酸链的相对链;
优选地,所述第四靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第四靶结合序列与所述第一、第二或第三靶结合序列不同;优选地,所述第四靶结合序列结合的核酸链与所述第三靶结合序列结合的核酸链是不同的;优选地,所述第四靶结合序列结合的核酸链是所述第三靶结合序列结合的核酸链的相对链;
优选地,在所述第四靶结合序列杂交或退火到所述断裂的靶核酸片段b1或b2的一条核酸链的3’端后,第四DNA聚合酶能够以第四标签引物为模板,延伸所述核酸链的3’端;优选地,所述延伸形成第四悬突;
优选地,所述第四标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第四标签序列与所述第一、第二或第三标签序列相同或不同;优选地,所述第四标签序列与所述第一、第二或第三标签序列不同;
优选地,所述第四DNA聚合酶与所述第一、第二或第三DNA聚合酶相同或者不同;优选地,所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶;
优选地,所述第四标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第四标签引物为单链核糖核酸,并且所述第四DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第四标签引物为单链脱氧核糖核酸,并且所述第四DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述第四引导序列与所述第三靶结合序列结合相同的核酸链,并且,所述第三靶结合序列的结合位置位于所述第四引导序列的结合位置的上游或5’端;
优选地,所述第三引导序列与所述第四靶结合序列结合相同的核酸链,并且,所述第四靶结合序列的结合位置位于所述第三引导序列的结合位置的上游或5’端;
优选地,所述第三悬突和第四悬突包含于不同的靶核酸片段上,且优选地,彼此位于相对的核酸链上;
优选地,在允许核酸杂交或退火的条件下,所述第四标签序列的互补序列或所述第四悬突能够与含有第一悬突或者第二悬突的核酸链杂交或退火;优选地,所述第四标签序列的互补序列或所述第四悬突能够与所述第一悬突或者第二悬突或其上游核苷酸序列杂交或退火;
优选地,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火,并且,所述第四标签序列的互补序列或所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火;或者,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火,并且,所述第四标签序列的互补序列或所述第四悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火;
优选地,所述核酸分子D4能够在细胞中转录出所述第四标签引物;
优选地,所述核酸分子D4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子D4为含有编码所述第四标签引物的核苷酸序列的表达载体(例如,真核表达载体)。
33.权利要求32所述的系统或试剂盒,其中,所述第四DNA聚合酶与所述第一、第二或第三DNA聚合酶不同;并且,所述系统或试剂盒还包含:
(16)所述第四DNA聚合酶或含有编码所述第四DNA聚合酶的核苷酸序列的核酸分子B4;
优选地,所述第四DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第四DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第四DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第四DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述核酸分子B4能够在细胞中表达所述第四DNA聚合酶;
优选地,所述核酸分子B4包含于表达载体(例如,真核表达载体)中,或者,所述核酸分子B4为含有编码所述第四DNA聚合酶的核苷酸序列的表达载体(例如,真核表达载体)。
34.权利要求32或33的系统或试剂盒,其中,所述第四标签引物与所述第四gRNA相连接;
优选地,所述第四标签引物通过接头或者不通过接头与所述第四gRNA共价相连接;
优选地,所述第四标签引物任选地通过接头连接至所述第四gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第四标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第四gRNA的3’端相连接,形成第四PegRNA;
优选地,所述核酸分子C4和核酸分子D4包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C4和核酸分子D4在细胞中能够转录出含有所述第四gRNA和所述第四标签引物的第四PegRNA;
优选地,所述系统或试剂盒包含:含有所述第四gRNA和所述第四标签引物的第四PegRNA,或者,含有编码所述第四PegRNA的核苷酸序列的核酸分子。
35.权利要求33或34的系统或试剂盒,其中,所述第四Cas蛋白与所述第四DNA聚合酶分离的或者相连接的;
优选地,所述第四Cas蛋白通过接头或者不通过接头与所述第四DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第四Cas蛋白通过肽接头或者不通过肽接头与所述第四DNA聚合酶融合,形成第四融合蛋白;
优选地,所述第四Cas蛋白任选地通过接头连接或融合至所述第四DNA聚合酶的N端;或者,所述第四Cas蛋白任选地通过接头连接或融合至所述第四DNA聚合酶的C端;
优选地,所述第四融合蛋白具有SEQ ID NO:52所示的氨基酸序列;
优选地,所述核酸分子A4和核酸分子B4包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A4和核酸分子B4在细胞中能够表达分离的所述第四Cas蛋白和所述第四DNA聚合酶,或者能够表达含有所述第四Cas蛋白和所述第四DNA聚合酶的第四融合蛋白;
优选地,所述系统或试剂盒包含,含有所述第四Cas蛋白和所述第四DNA聚合酶的第四融合蛋白,或者,含有编码所述第四融合蛋白的核苷酸序列的核酸分子;或者,分离的所述第四Cas蛋白和第四DNA聚合酶,或者,能够表达分离的所述第四Cas蛋白和第四DNA聚合酶的核酸分子。
36.权利要求32或34的系统或试剂盒,其中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶;并且,所述系统或试剂盒包含:
(M1-1)含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白,或者,含有编码所述第一融合蛋白的核苷酸序列的核酸分子;或,(M1-2)分离的所述第一Cas蛋白和第一DNA聚合酶,或者,能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子;
(M2)含有所述第一gRNA和第一标签引物的第一PegRNA,或者,含有编码所述第一PegRNA的核苷酸序列的核酸分子;
(M3)含有所述第二gRNA和第二标签引物的第二PegRNA,或者,含有编码所述第二PegRNA的核苷酸序列的核酸分子;
(M4)含有所述第三gRNA和第三标签引物的第三PegRNA,或者,含有编码所述第三PegRNA的核苷酸序列的核酸分子;
(M5)含有所述第四gRNA和第四标签引物的第四PegRNA,或者,含有编码所述第四PegRNA的核苷酸序列的核酸分子;
优选地,所述系统或试剂盒还包含:权利要求16-18任一项中所定义的核酸载体。
37.权利要求32-36任一项的系统或试剂盒,其中,所述第四双链靶核酸与所述第三双链靶核酸是相同的,并且,所述第三和第四功能性复合物在不同的位置断裂所述相同的双链靶核酸,形成断裂的核苷酸片段a1、a2和a3;其中,在所述相同的双链靶核酸中,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连;
优选地,所述第三和第四功能性复合物分别导致核苷酸片段a1和a2的分离以及核苷酸片段a2和a3的分离;
优选地,所述核苷酸片段a1具有以第三标签引物为模板延伸形成的第三悬突;并且,所述核苷酸片段a3具有以第四标签引物为模板延伸形成的第四悬突;
优选地,在允许核酸杂交或退火的条件下,所述第一标签序列或其互补序列或所述第一悬突能够与断裂的核苷酸片段a1杂交或退火;优选地,所述第一标签序列或其互补序列或所述第一悬突能够在第三功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a1杂交或退火;优选地,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述第三双链靶核酸而形成的;优选地,所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的第三悬突或其上游核苷酸序列;
优选地,在允许核酸杂交或退火的条件下,所述第三标签序列的互补序列或所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火;
优选地,在允许核酸杂交或退火的条件下,所述第二标签序列或其互补序列或所述第二悬突能够与断裂的核苷酸片段a3杂交或退火;优选地,所述第二标签序列或其互补序列或所述第二悬突能够在第四功能性复合物断裂第三双链靶核酸所形成的末端处与断裂的核苷酸片段a3杂交或退火;优选地,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述第三双链靶核酸而形成的;优选地,所述第二悬突能够杂交或退火到断裂的核苷酸片段a3的第四悬突或其上游核苷酸序列;
优选地,在允许核酸杂交或退火的条件下,所述第四标签序列的互补序列或所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火。
38.权利要求1-37任一项的系统或试剂盒,所述试剂盒还包含额外的组分;
优选地,所述额外的组分包括选自下列的一项或多项:
(1)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的gRNA或含有编码所述额外的gRNA的核苷酸序列的核酸分子,其中,所述额外的gRNA能够与Cas蛋白结合,并形成功能性复合物;优选地,所述功能性复合物能够将双链靶核酸的两条链断裂,形成断裂的靶核酸片段;
(2)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的Cas蛋白或含有编码所述额外的Cas蛋白的核苷酸序列的核酸分子;优选地,所述Cas蛋白能够切割或断裂双链靶核酸;
(3)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的标签引物或含有编码所述额外的标签引物的核苷酸序列的核酸分子,其中,所述额外的标签引物含有标签序列和靶结合序列,所述标签序列位于所述靶结合序列的上游或5’端;优选地,在允许核酸杂交或退火的条件下,所述靶结合序列能够杂交或退火到所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构,且,所述标签序列不与所述靶核酸片段结合,处于游离的单链状态;
(4)一个或多个(例如,2个,3个,4个,5个,10个,15个,20个,或更多个)额外的DNA聚合酶或含有编码所述额外的DNA聚合酶的核苷酸序列的核酸分子;优选地,所述额外的DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;优选地,所述额外的DNA聚合酶为依赖于RNA的DNA聚合酶,例如逆转录酶。
39.一种融合蛋白,其包含Cas蛋白与依赖于模板的DNA聚合酶,其中,所述Cas蛋白能够断裂双链靶核酸;
优选地,所述Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端;
优选地,所述Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述Cas蛋白通过接头或者不通过接头与所述DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述Cas蛋白任选地通过接头连接或融合至所述DNA聚合酶的N端;或者,所述Cas蛋白任选地通过接头连接或融合至所述DNA聚合酶的C端;
优选地,所述融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
40.一种核酸分子,其包含编码权利要求39所述的融合蛋白的多核苷酸。
41.一种载体,其包含权利要求40所述的核酸分子;
优选地,所述载体为表达载体;
优选地,所述载体为真核表达载体。
42.一种宿主细胞,其包含权利要求40所述的核酸分子或权利要求41所述的载体;
优选地,所述宿主细胞为原核细胞,例如大肠杆菌细胞;或者所述宿主细胞为真核细胞,例如,酵母细胞,真菌细胞,植物细胞,动物细胞;
优选地,所述宿主细胞为哺乳动物细胞,例如人细胞。
43.一种制备权利要求39所述的融合蛋白的方法,其包括,(1)在允许蛋白表达的条件下,培养权利要求42所述的宿主细胞;和(2)分离所述宿主细胞表达的融合蛋白。
44.一种复合物,其包含第一Cas蛋白与依赖于模板的第一DNA聚合酶,其中,所述第一Cas蛋白具有断裂双链靶核酸的能力,并且,所述第一Cas蛋白通过共价或者非共价的方式与第一DNA聚合酶复合;
优选地,所述第一Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端;
优选地,所述第一Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas13a蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第一Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第一Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述第一DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第一DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第一DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述第一Cas蛋白通过接头或者不通过接头与所述第一DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第一Cas蛋白通过肽接头或者不通过肽接头与所述第一DNA聚合酶融合,形成融第一合蛋白;
优选地,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的N端;或者,所述第一Cas蛋白任选地通过接头连接或融合至所述第一DNA聚合酶的C端;
优选地,所述第一融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
45.权利要求44的复合物,其中,所述复合物还包含第一gRNA;
优选地,所述第一gRNA能够与所述第一Cas蛋白结合,并形成第一功能性单元;所述第一功能性单元能够结合双链靶核酸,并将其两条链断裂,形成断裂的靶核酸片段;
优选地,所述第一gRNA含有第一引导序列,并且,在允许核酸杂交或退火的条件下,所述第一引导序列能够杂交或退火至双链靶核酸的一条核酸链;
优选地,所述第一引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一gRNA还含有第一支架序列,其能够被所述第一Cas蛋白识别并结合,从而形成第一功能性单元;
优选地,所述第一支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一引导序列位于所述第一支架序列的上游或5’端;
优选地,所述复合物或第一功能性单元在所述第一引导序列与双链靶核酸结合后,能够将双链靶核酸的两条链断裂,形成断裂的靶核酸片段。
46.权利要求45的复合物,其中,所述复合物还包含双链靶核酸,
优选地,所述双链靶核酸含有所述第一Cas蛋白识别的第一PAM序列以及能够与所述第一引导序列杂交或退火的第一引导结合序列,由此,所述第一功能性单元通过所述第一引导结合序列和所述第一PAM序列,结合所述双链靶核酸。
47.权利要求46的复合物,其中,所述复合物还包含与所述双链靶核酸杂交或退火的第一标签引物;其中,所述第一标签引物含有第一靶结合序列,其能够与所述双链靶核酸杂交或退火;
优选地,所述标签引物含有第一标签序列和第一靶结合序列,所述第一标签序列位于所述第一靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第一靶结合序列能够杂交或退火至所述双链靶核酸;优选地,所述第一靶结合序列能够杂交或退火至所述双链靶核酸被所述第一功能性单元断裂的位置处;优选地,所述第一靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构;优选地,所述3’端是因所述第一功能性单元断裂所述双链靶核酸而形成的;优选地,所述第一标签序列不与所述靶核酸片段结合,处于游离的单链状态;
优选地,所述第一靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第一标签引物通过所述第一靶结合序列结合至所述断裂的靶核酸片段;优选地,所述第一DNA聚合酶与所述断裂的靶核酸片段和所述第一标签引物结合;
优选地,所述第一标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第一标签引物为单链核糖核酸,并且所述第一DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第一标签引物为单链脱氧核糖核酸,并且所述第一DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述断裂的靶核酸片段被所述第一DNA聚合酶以所述第一标签引物为模板延伸,形成第一悬突;
优选地,所述第一gRNA结合的核酸链与所述第一标签引物结合的核酸链是不同的;优选地,所述第一gRNA结合的核酸链是所述第一标签引物结合的核酸链的相对链。
48.权利要求47的复合物,其中,所述第一标签引物与所述第一gRNA相连接;
优选地,所述第一标签引物通过接头或者不通过接头与所述第一gRNA共价相连接;
优选地,所述第一标签引物任选地通过接头连接至所述第一gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第一标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第一gRNA的3’端相连接,形成第一PegRNA。
49.权利要求47或48的复合物,其中,所述复合物还包含第二Cas蛋白和第二gRNA,其中,所述第二Cas蛋白具有断裂双链靶核酸的能力,所述第二gRNA能够与所述第二Cas蛋白结合,并形成第二功能性单元;所述第二功能性单元能够结合双链靶核酸,并将其两条链断裂,形成断裂的靶核酸片段;
优选地,所述第二Cas蛋白与所述第一Cas蛋白相同或者不同;优选地,所述第二Cas蛋白与所述第一Cas蛋白相同;
优选地,所述第二Cas蛋白能够断裂双链靶核酸,并产生粘末端或平末端;
优选地,所述第二Cas蛋白选自Cas9蛋白、Cas12a蛋白、cas12b蛋白、cas12c蛋白、cas12d蛋白、cas12e蛋白、cas12f蛋白、cas12g蛋白、cas12h蛋白、cas12i蛋白、cas14蛋白、Cas1蛋白、Cas1B蛋白、Cas2蛋白、Cas3蛋白、Cas4蛋白、Cas5蛋白、Cas6蛋白、Cas7蛋白、Cas8蛋白、Cas10蛋白、Csy1蛋白、Csy2蛋白、Csy3蛋白、Cse1蛋白、Cse2蛋白、Csc1蛋白、Csc2蛋白、Csa5蛋白、Csn2蛋白、Csm2蛋白、Csm3蛋白、Csm4蛋白、Csm5蛋白、Csm6蛋白、Cmr1蛋白、Cmr3蛋白、Cmr4蛋白、Cmr5蛋白、Cmr6蛋白、Csb1蛋白、Csb2蛋白、Csb3蛋白、Csx17蛋白、Csx14蛋白、Csx10蛋白、Csx16蛋白、CsaX蛋白、Csx3蛋白、Csx1蛋白、Csx15蛋白、Csf1蛋白、Csf2蛋白、Csf3蛋白、Csf4蛋白及其同源物或其修饰形式;
优选地,所述第二Cas蛋白为Cas9蛋白,例如酿脓链球菌(S.pyogenes)的Cas9蛋白(spCas9);
优选地,所述第二Cas蛋白具有SEQ ID NO:1所示的氨基酸序列;
优选地,所述第二gRNA含有第二引导序列,并且,在允许核酸杂交或退火的条件下,所述第二引导序列能够杂交或退火至双链靶核酸的一条核酸链;
优选地,所述第二引导序列与所述第一引导序列不同;优选地,所述第一引导序列结合的核酸链与所述第二引导序列结合的核酸链是不同的;优选地,所述第一引导序列结合的核酸链是所述第二引导序列结合的核酸链的相对链;
优选地,所述第二引导序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二gRNA还含有第二支架序列,其能够被所述第二Cas蛋白识别并结合,从而形成第二功能性单元;
优选地,所述第二支架序列与所述第一支架序列相同或者不同;优选地,所述第二支架序列与所述第一支架序列相同;
优选地,所述第二支架序列的长度为至少20nt,例如20-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二引导序列位于所述第二支架序列的上游或5’端;
优选地,所述双链靶核酸含有所述第二Cas蛋白识别的第二PAM序列以及能够与所述第二引导序列杂交或退火的第二引导结合序列,由此,所述第二功能性单元通过所述第二引导结合序列和所述第二PAM序列,结合所述双链靶核酸。
50.权利要求49的复合物,其中,所述复合物还包含依赖于模板的第二DNA聚合酶,所述第二DNA聚合酶通过共价或者非共价的方式与第二Cas蛋白复合;
优选地,所述第二DNA聚合酶选自依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶;
优选地,所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;
优选地,所述第二DNA聚合酶为逆转录酶,例如来自莫洛尼氏鼠白血病病毒人免疫缺陷病毒(HIV),禽肉瘤-白血病病毒(ASLV),Rous肉瘤病毒(RSV),禽成髓细胞增多症病毒(AMV),禽成红细胞增多症病毒辅助病毒,禽粒细胞瘤病毒MC29辅助病毒,禽网状内皮组织增生病毒辅助病毒,禽肉瘤病毒UR2辅助病毒,禽肉瘤病毒Y73辅助病毒,Rous相关病毒和成髓细胞增多相关病毒(MAV)的逆转录酶;
优选地,所述第二DNA聚合酶具有SEQ ID NO:4所示的氨基酸序列;
优选地,所述第二DNA聚合酶与所述第一DNA聚合酶相同或者不同;优选地,所述第二DNA聚合酶与所述第一DNA聚合酶相同;
优选地,所述第二Cas蛋白通过接头或者不通过接头与所述第二DNA聚合酶共价相连接;
优选地,所述接头为肽接头,例如柔性肽接头;例如,所述接头具有SEQ ID NO:51所示的氨基酸序列;
优选地,所述第二Cas蛋白通过肽接头或者不通过肽接头与所述第二DNA聚合酶融合,形成融第二合蛋白;
优选地,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的N端;或者,所述第二Cas蛋白任选地通过接头连接或融合至所述第二DNA聚合酶的C端;
优选地,所述第二融合蛋白具有SEQ ID NO:52所示的氨基酸序列。
51.权利要求50的复合物,其中,所述复合物还包含与所述双链靶核酸杂交或退火的第二标签引物;其中,所述第二标签引物含有第二靶结合序列,其能够与所述双链靶核酸杂交或退火;
优选地,所述标签引物含有第二标签序列和第二靶结合序列,所述第二标签序列位于所述第二靶结合序列的上游或5’端;并且,在允许核酸杂交或退火的条件下,所述第二靶结合序列能够杂交或退火至所述双链靶核酸;优选地,所述第二靶结合序列能够杂交或退火至所述双链靶核酸被所述第二功能性单元断裂的位置处;优选地,所述第二靶结合序列能够杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端,形成双链结构;优选地,所述3’端是因所述第二功能性单元断裂所述双链靶核酸而形成的;优选地,所述第二标签序列不与所述靶核酸片段结合,处于游离的单链状态;
优选地,所述第二靶结合序列的长度为至少5nt,例如5-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二靶结合序列与所述第一靶结合序列不同;优选地,所述第二靶结合序列结合的核酸链与所述第一靶结合序列结合的核酸链是不同的;优选地,所述第二靶结合序列结合的核酸链是所述第一靶结合序列结合的核酸链的相对链;
优选地,所述第二标签序列的长度为至少4nt,例如4-10nt,10-15nt,15-20nt,20-25nt,25-30nt,30-40nt,40-50nt,50-100nt,100-200nt,或者更长;
优选地,所述第二标签序列与所述第一标签序列相同或不同;优选地,所述第二标签序列与所述第一标签序列不同;
优选地,所述第二标签引物通过所述第二靶结合序列结合至所述断裂的靶核酸片段;优选地,所述第二DNA聚合酶与所述断裂的靶核酸片段和所述第二标签引物结合;
优选地,所述第二标签引物为单链脱氧核糖核酸或者单链核糖核酸;
优选地,所述第二标签引物为单链核糖核酸,并且所述第二DNA聚合酶为依赖于RNA的DNA聚合酶;或者,所述第二标签引物为单链脱氧核糖核酸,并且所述第二DNA聚合酶为依赖于DNA的DNA聚合酶;
优选地,所述断裂的靶核酸片段被所述第二DNA聚合酶以所述第二标签引物为模板延伸,形成第二悬突;
优选地,所述第二gRNA结合的核酸链与所述第二标签引物结合的核酸链是不同的;优选地,所述第二gRNA结合的核酸链是所述第二标签引物结合的核酸链的相对链。
52.权利要求51的复合物,其中,所述第二标签引物与所述第二gRNA相连接;
优选地,所述第二标签引物通过接头或者不通过接头与所述第二gRNA共价相连接;
优选地,所述第二标签引物任选地通过接头连接至所述第二gRNA的3’端;
优选地,所述接头为核酸接头(例如核糖核酸接头或脱氧核糖核酸接头);
优选地,所述第二标签引物为单链核糖核酸,并且,其通过核糖核酸接头或者不通过核糖核酸接头与所述第二gRNA的3’端相连接,形成第二PegRNA。
53.权利要求52的复合物,其中,所述第一和第二功能性单元以预定的位置关系结合双链靶核酸;
优选地,所述第二引导序列与所述第一靶结合序列结合相同的核酸链;和/或,所述第一引导序列与所述第二靶结合序列结合相同的核酸链;
优选地,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的上游或5’端;和/或,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的上游或5’端;
优选地,所述第二引导序列的结合位置位于所述第一靶结合序列的结合位置的下游或3’端;和/或,所述第一引导序列的结合位置位于所述第二靶结合序列的结合位置的下游或3’端;
优选地,所述双链靶核酸选自基因组DNA和核酸载体DNA。
54.一种方法,其用于将双链靶核酸断裂并在其3’端添加悬突,其中,所述方法包括,使用权利要求1-9任一项所述的系统或试剂盒。
55.权利要求54的方法,其中,所述方法包括以下步骤:
i.提供双链靶核酸;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物接触;
优选地,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,并且,所述第一功能性复合物结合并断裂所述双链靶核酸,形成断裂的靶核酸片段;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述断裂的靶核酸片段的一条核酸链的3’端;并且,
所述第一DNA聚合酶以退火至所述断裂的靶核酸片段的第一标签引物为模板,延伸所述断裂的靶核酸片段,形成第一悬突;
优选地,所述方法在细胞内进行;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1以及所述第一标签引物或核酸分子D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1和所述第一标签引物或核酸分子D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
优选地,在步骤i中,将所述核酸分子A1、B1、C1和D1递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子,以及含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶和第一标签引物;
优选地,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸;
优选地,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如权利要求1-9任一项所定义;
优选地,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列;优选地,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
56.一种方法,其用于将双链靶核酸断裂为靶核酸片段,并在所述靶核酸片段的两个3’端分别添加悬突,其中,所述方法包括,使用权利要求10-18任一项所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的。
57.权利要求56的方法,其中,所述方法包括以下步骤:
i.提供双链靶核酸;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触;
优选地,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,且所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物;并且,所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;
优选地,所述方法在细胞内进行;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2以及D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子A2和核酸分子B2包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A2和核酸分子B2在细胞中能够表达分离的所述第二Cas蛋白和所述第二DNA聚合酶,或者能够表达含有所述第二Cas蛋白和所述第二DNA聚合酶的第二融合蛋白;优选地,在步骤i中,将能够表达分离的所述第二Cas蛋白和第二DNA聚合酶的核酸分子或者含有编码所述第二融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第二Cas蛋白和所述第二DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;优选地,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
优选地,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸;
优选地,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如权利要求1-9任一项所定义;
优选地,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如权利要求10-18任一项所定义;
优选地,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列;优选地,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂。
58.权利要求57的方法,其中,所述第二Cas蛋白与所述第一Cas蛋白相同,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一和第二gRNA分别形成第一和第二功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物;
优选地,在步骤i中,所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2以及所述第二标签引物或核酸分子D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物;
优选地,在步骤i中,所述核酸分子A1、B1、C1、D1、C2以及D2递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;优选地,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子以及含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA和第二标签引物。
59.一种方法,其用于将靶核酸片段插入感兴趣的核酸分子;其中,所述方法包括,使用权利要求19-27任一项所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的,用于提供所述靶核酸片段;并且,所述第三双链靶核酸为感兴趣的核酸分子。
60.权利要求59的方法,其中,所述方法包括:
a.通过权利要求56-58任一项的方法,将所述第一双链靶核酸断裂为靶核酸片段F1,并在所述靶核酸片段F1的两个3’端分别添加悬突,形成具有第一悬突和第二悬突的靶核酸片段F2;
b.用所述第三功能性复合物将所述感兴趣的核酸分子断裂,形成断裂的核苷酸片段a1和a2;以及,
c.用所述靶核酸片段F2连接所述核苷酸片段a1和a2,从而将所述靶核酸片段插入所述感兴趣的核酸分子;
优选地,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三Cas蛋白和第三gRNA接触;
优选地,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,且所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1和a2;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a2杂交或退火;并且,
所述靶核酸片段F2通过第一悬突和第二悬突分别与核苷酸片段a1和a2杂交或退火,进而被插入或连接至核苷酸片段a1和a2之间,从而,将所述靶核酸片段插入所述感兴趣的核酸分子中;
优选地,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的;
优选地,所述第一标签序列的互补序列或所述第一悬突能够杂交或退火到断裂的核苷酸片段a1的一条核酸链的3’部分,且所述核苷酸片段a1的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第一间隔区域;
优选地,所述第一间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt;
优选地,所述第二悬突能够杂交或退火到所述核苷酸片段a2的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的;
优选地,所述第二标签序列的互补序列或所述第二悬突能够杂交或退火到断裂的核苷酸片段a2的一条核酸链的3’部分,且所述核苷酸片段a2的3’部分与所述第三双链靶核酸所形成的断裂末端之间具有第二间隔区域;
优选地,所述第二间隔区域的长度为1nt-200nt,例如1-10nt,10-20nt,20-30nt,30-40nt,40-50nt,50-100nt或100-200nt;
优选地,所述方法在细胞内进行;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3和C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白和第三gRNA;
优选地,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸;
优选地,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列;优选地,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;
优选地,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列;优选地,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂;
优选地,所述感兴趣的核酸分子是所述细胞的基因组DNA;
优选地,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如权利要求1-9任一项所定义;
优选地,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如权利要求10-18任一项所定义;
优选地,所述第三Cas蛋白和第三gRNA如权利要求19-27任一项所定义。
61.权利要求60的方法,其中,所述第一、第二和第三Cas蛋白是相同的Cas蛋白,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一、第二和第三gRNA分别形成第一、第二和第三功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2和所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2以及所述第三gRNA或核酸分子C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2以及C3递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;优选地,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子以及含有编码所述第三gRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物和第三gRNA。
62.一种方法,其用于将靶核酸片段置换感兴趣的核酸分子中的核苷酸片段;其中,所述方法包括,使用权利要求28-37任一项所述的系统或试剂盒;其中,所述第一双链靶核酸与所述第二双链靶核酸是相同的,用于提供所述靶核酸片段;并且,所述第三双链靶核酸与所述第四双链靶核酸是相同的,为感兴趣的核酸分子;
优选地,所述方法包括:
a.通过权利要求56-58任一项的方法,将所述第一双链靶核酸断裂为靶核酸片段F1,并在所述靶核酸片段F1的两个3’端分别添加悬突,形成具有第一悬突和第二悬突的靶核酸片段F2;
b.用所述第三和第四功能性复合物断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;其中,在断裂之前,在所述感兴趣的核酸分子中,核苷酸片段a1、a2和a3依次排列(即,核苷酸片段a1通过核苷酸片段a2与核苷酸片段a3相连);以及,
c.用所述靶核酸片段F2连接所述核苷酸片段a1和a3,从而将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段;
63.权利要求62的方法,其中,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、所述第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA;
ii将所述双链靶核酸与所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA接触;
优选地,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物,且所述第四Cas蛋白和第四gRNA相结合形成第四功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三和第四功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a3杂交或退火;并且,
所述靶核酸片段F2通过第一悬突和第二悬突分别与核苷酸片段a1和a3杂交或退火,进而连接在核苷酸片段a1和a3之间,从而,将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段;
优选地,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的;
优选地,所述第二悬突能够杂交或退火到所述核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述感兴趣的核酸分子而形成的;
优选地,所述方法在细胞内进行;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3、所述第三gRNA或核酸分子C3、所述第四Cas蛋白或核酸分子A4、所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA;
优选地,在步骤i中,所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3、所述第三gRNA或核酸分子C3、所述核酸分子A4以及所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA;
优选地,在步骤i中,所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3、C3、A4和C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二Cas蛋白、第二gRNA、第二DNA聚合酶、第二标签引物、第三Cas蛋白、第三gRNA、第四Cas蛋白和第四gRNA;
优选地,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸;
优选地,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列;优选地,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;
优选地,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列以及第四Cas蛋白识别的第四PAM序列;优选地,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂;并且,所述第四功能性复合物通过所述第四PAM序列和所述第四gRNA与所述感兴趣的核酸分子结合,并将其断裂;
优选地,所述感兴趣的核酸分子是所述细胞的基因组DNA;
优选地,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如权利要求1-9任一项所定义;
优选地,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如权利要求10-18任一项所定义;
优选地,所述第三Cas蛋白和第三gRNA如权利要求19-27任一项所定义;
优选地,所述第四Cas蛋白和第四gRNA如权利要求28-37任一项所定义。
64.权利要求63的方法,其中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,并且所述第二DNA聚合酶与所述第一DNA聚合酶相同;其中,所述第一Cas蛋白与所述第一、第二、第三和第四gRNA分别形成第一、第二、第三和第四功能性复合物,并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3和所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3和所述第四gRNA或核酸分子C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2、C3以及C4递送入细胞中,以在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;优选地,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子、含有编码所述第三gRNA的核苷酸序列的核酸分子以及含有编码所述第四gRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行转录和表达,从而在细胞内提供所述第一Cas蛋白、第一gRNA、第一DNA聚合酶、第一标签引物、第二gRNA、第二标签引物、第三gRNA和第四gRNA。
65.权利要求62的方法,其中,所述方法包括以下步骤:
i.提供双链靶核酸和感兴趣的核酸分子;和
提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物;
ii将所述双链靶核酸与所述第一和第二Cas蛋白、第一和第二gRNA、第一和第二DNA聚合酶、第一和第二标签引物接触,并且,将所述感兴趣的核酸分子与所述第三和第四Cas蛋白、第三和第四gRNA、第三和第四DNA聚合酶,以及第三和第四标签引物接触;
优选地,在步骤ii中:
所述第一Cas蛋白和第一gRNA相结合形成第一功能性复合物,所述第二Cas蛋白和第二gRNA相结合形成第二功能性复合物,所述第三Cas蛋白和第三gRNA相结合形成第三功能性复合物,且所述第四Cas蛋白和第四gRNA相结合形成第四功能性复合物;并且,
所述第一和第二功能性复合物结合并断裂所述双链靶核酸,形成靶核酸片段F1,且,所述第三和第四功能性复合物结合并断裂所述感兴趣的核酸分子,形成断裂的核苷酸片段a1、a2和a3;并且,
所述第一标签引物通过所述第一靶结合序列杂交或退火至所述靶核酸片段F1的一条核酸链的3’端;且,所述第二标签引物通过所述第二靶结合序列杂交或退火至所述靶核酸片段F1的另一条核酸链的3’端;并且,
所述第一DNA聚合酶和第二DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;其中,所述第一悬突和第二悬突分别能够与断裂的核苷酸片段a1和a3杂交或退火;并且,
所述第三标签引物通过所述第三靶结合序列杂交或退火至所述核苷酸片段a1的一条核酸链的3’端,其中,所述3’端是因所述第三功能性复合物断裂感兴趣的核酸分子而形成的;且,所述第四标签引物通过所述第四靶结合序列杂交或退火至所述核苷酸片段a3的一条核酸链的3’端,其中,所述3’端是因所述第四功能性复合物断裂感兴趣的核酸分子而形成的;并且,
所述第三DNA聚合酶以退火至所述核苷酸片段a1的第三标签引物为模板,延伸所述核苷酸片段a1,形成具有第三悬突的核苷酸片段a1;且,所述第四DNA聚合酶以退火至所述核苷酸片段a3的第四标签引物为模板,延伸所述核苷酸片段a3,形成具有第四悬突的核苷酸片段a3;其中,所述第三悬突和第四悬突分别能够与所述靶核酸片段F2杂交或退火;并且,
通过所述第一、第二、第三和第四悬突,所述靶核酸片段F2分别与核苷酸片段a1和a3杂交或退火,进而连接在核苷酸片段a1和a3之间,从而,将感兴趣的核酸分子中的核苷酸片段a2替换为所述靶核酸片段;
优选地,所述第一悬突能够杂交或退火到所述核苷酸片段a1的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第三功能性复合物断裂所述感兴趣的核酸分子而形成的;优选地,所述第一悬突能够杂交或退火到核苷酸片段a1的第三悬突或其上游核苷酸序列;
优选地,所述第二悬突能够杂交或退火到所述核苷酸片段a3的一条核酸链的3’端或3’部分,并且所述3’端或3’部分是因所述第四功能性复合物断裂所述感兴趣的核酸分子而形成的;优选地,所述第二悬突能够杂交或退火到核苷酸片段a3的第四悬突或其上游核苷酸序列;
优选地,所述第三悬突能够与所述第一悬突或其上游核苷酸序列杂交或退火;
优选地,所述第四悬突能够与所述第二悬突或其上游核苷酸序列杂交或退火;
优选地,所述方法在细胞内进行;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二Cas蛋白或核酸分子A2、所述第二DNA聚合酶或核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三Cas蛋白或核酸分子A3、所述第三DNA聚合酶或核酸分子B3、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四Cas蛋白或核酸分子A4、所述第四DNA聚合酶或核酸分子B4、所述第四gRNA或核酸分子C4以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述核酸分子A2、所述核酸分子B2、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述核酸分子A3、所述核酸分子B3、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述核酸分子A4、所述核酸分子B4、所述第四gRNA或核酸分子C4以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、A2、B2、C2、D2、A3、B3、C3、D3、A4、B4、C4、D4递送入细胞中,以在细胞内提供第一、第二、第三和第四Cas蛋白,所述第一、第二、第三和第四gRNA,所述第一、第二、第三和第四DNA聚合酶,以及所述第一、第二、第三和第四标签引物;
优选地,在步骤i中,将所述双链靶核酸或含有所述双链靶核酸的核酸分子T递送入细胞中,以在细胞内提供所述双链靶核酸;
优选地,所述双链靶核酸或核酸分子T含有第一Cas蛋白识别的第一PAM序列以及第二Cas蛋白识别的第二PAM序列;优选地,在步骤ii中,所述第一功能性复合物通过所述第一PAM序列和所述第一gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;并且,所述第二功能性复合物通过所述第二PAM序列和所述第二gRNA与所述双链靶核酸或核酸分子T结合,并将其断裂;
优选地,所述感兴趣的核酸分子含有第三Cas蛋白识别的第三PAM序列以及第四Cas蛋白识别的第四PAM序列;优选地,在步骤ii中,所述第三功能性复合物通过所述第三PAM序列和所述第三gRNA与所述感兴趣的核酸分子结合,并将其断裂;并且,所述第四功能性复合物通过所述第四PAM序列和所述第四gRNA与所述感兴趣的核酸分子结合,并将其断裂;
优选地,所述感兴趣的核酸分子是所述细胞的基因组DNA;
优选地,所述第一Cas蛋白、第一gRNA、第一DNA聚合酶或第一标签引物如权利要求1-9任一项所定义;
优选地,所述第二Cas蛋白、第二gRNA、第二DNA聚合酶或第二标签引物如权利要求10-18任一项所定义;
优选地,所述第三Cas蛋白、第三gRNA、第三DNA聚合酶或第三标签引物如权利要求19-27任一项所定义;
优选地,第四Cas蛋白、第四gRNA、第四DNA聚合酶或第四标签引物如权利要求28-37任一项所定义。
66.权利要求65的方法,其中,所述第一、第二、第三和第四Cas蛋白是相同的Cas蛋白,并且所述第一、第二、第三和第四DNA聚合酶是相同的DNA聚合酶;其中,所述第一Cas蛋白与所述第一、第二、第三和第四gRNA分别形成第一、第二、第三和第四功能性复合物;并且,所述第一DNA聚合酶分别以退火至所述靶核酸片段F1的第一标签引物和第二标签引物为模板,延伸所述靶核酸片段F1,形成具有第一悬突和第二悬突的靶核酸片段F2;并且,所述第一DNA聚合酶分别以第三标签引物和第四标签引物为模板,延伸所述核苷酸片段a1和a3,形成第三和第四悬突;
优选地,在步骤i中,将所述第一Cas蛋白或核酸分子A1、所述第一DNA聚合酶或核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四gRNA或核酸分子C4、以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物;
优选地,在步骤i中,将所述核酸分子A1、所述核酸分子B1、所述第一gRNA或核酸分子C1、所述第一标签引物或核酸分子D1、所述第二gRNA或核酸分子C2、所述第二标签引物或核酸分子D2、所述第三gRNA或核酸分子C3、所述第三标签引物或核酸分子D3、所述第四gRNA或核酸分子C4、以及所述第四标签引物或核酸分子D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物;
优选地,在步骤i中,将所述核酸分子A1、B1、C1、D1、C2、D2、C3、D3、C4和D4递送入细胞中,以在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物;
优选地,所述核酸分子A1和核酸分子B1包含于相同或不同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子A1和核酸分子B1在细胞中能够表达分离的所述第一Cas蛋白和所述第一DNA聚合酶,或者能够表达含有所述第一Cas蛋白和所述第一DNA聚合酶的第一融合蛋白;优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或者含有编码所述第一融合蛋白的核苷酸序列的核酸分子递送入细胞中,并在细胞中进行表达,以在细胞内提供所述第一Cas蛋白和所述第一DNA聚合酶;
优选地,所述核酸分子C1和核酸分子D1包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C1和核酸分子D1在细胞中能够转录出含有所述第一gRNA和所述第一标签引物的第一PegRNA;优选地,在步骤i中,将所述第一PegRNA递送入细胞中以在细胞内提供所述第一gRNA和所述第一标签引物,或者,将含有编码所述第一PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第一PegRNA,以在细胞内提供所述第一gRNA和所述第一标签引物;
优选地,所述核酸分子C2和核酸分子D2包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C2和核酸分子D2在细胞中能够转录出含有所述第二gRNA和所述第二标签引物的第二PegRNA;优选地,在步骤i中,将所述第二PegRNA递送入细胞中以在细胞内提供所述第二gRNA和所述第二标签引物,或者,将含有编码所述第二PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第二PegRNA,以在细胞内提供所述第二gRNA和所述第二标签引物;
优选地,所述核酸分子C3和核酸分子D3包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C3和核酸分子D3在细胞中能够转录出含有所述第三gRNA和所述第三标签引物的第三PegRNA;优选地,在步骤i中,将所述第三PegRNA递送入细胞中以在细胞内提供所述第三gRNA和所述第三标签引物,或者,将含有编码所述第三PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第三PegRNA,以在细胞内提供所述第三gRNA和所述第三标签引物;
优选地,所述核酸分子C4和核酸分子D4包含于相同的表达载体(例如,真核表达载体)中;优选地,所述核酸分子C4和核酸分子D4在细胞中能够转录出含有所述第四gRNA和所述第四标签引物的第四PegRNA;优选地,在步骤i中,将所述第四PegRNA递送入细胞中以在细胞内提供所述第四gRNA和所述第四标签引物,或者,将含有编码所述第四PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中转录所述第四PegRNA,以在细胞内提供所述第四gRNA和所述第四标签引物;
优选地,在步骤i中,将能够表达分离的所述第一Cas蛋白和第一DNA聚合酶的核酸分子或含有编码所述第一融合蛋白的核苷酸序列的核酸分子、含有编码所述第一PegRNA的核苷酸序列的核酸分子、含有编码所述第二PegRNA的核苷酸序列的核酸分子、含有编码所述第三PegRNA的核苷酸序列的核酸分子以及含有编码所述第四PegRNA的核苷酸序列的核酸分子递送入细胞中,并在细胞中表达第一融合蛋白和转录第一、第二、第三和第四PegRNA,从而在细胞内提供所述第一Cas蛋白,第一DNA聚合酶,第一、第二、第三和第四gRNA,以及第一、第二、第三和第四标签引物。
CN202110780360.8A 2020-07-10 2021-07-09 一种编辑核酸的系统及方法 Pending CN113913405A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020106630768 2020-07-10
CN202010663076 2020-07-10

Publications (1)

Publication Number Publication Date
CN113913405A true CN113913405A (zh) 2022-01-11

Family

ID=79232949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110780360.8A Pending CN113913405A (zh) 2020-07-10 2021-07-09 一种编辑核酸的系统及方法

Country Status (3)

Country Link
EP (1) EP4180460A1 (zh)
CN (1) CN113913405A (zh)
WO (1) WO2022007959A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023029492A1 (zh) * 2021-09-03 2023-03-09 中国科学院动物研究所 一种外源基因定点整合的系统及方法
WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023225358A1 (en) * 2022-05-20 2023-11-23 The Board Of Trustees Of The Leland Stanford Junior University Generation and tracking of cells with precise edits

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016073990A2 (en) * 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CN107686842A (zh) * 2016-08-03 2018-02-13 南京大学 一种靶多核苷酸编辑方法及其应用
CN108124453A (zh) * 2015-03-31 2018-06-05 爱克莱根科技公司 用于将DNA序列靶向并入细胞或生物体的基因组中的Cas9逆转录病毒整合酶和Cas9重组酶系统
CN108192956A (zh) * 2017-11-17 2018-06-22 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
WO2020120711A1 (en) * 2018-12-12 2020-06-18 Depixus Method of nucleic acid enrichment using site-specific nucleases followed by capture
WO2020124257A1 (en) * 2018-12-21 2020-06-25 Tremblay Jacques P App modification via base editing using the crispr/cas9 system
CN111378051A (zh) * 2020-03-25 2020-07-07 北京市农林科学院 Pe-p2引导编辑系统及其在基因组碱基编辑中的应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198944A1 (en) 2001-06-20 2002-12-26 Moss Pamela M. Method for distributing large files to multiple recipients
EP3707266A1 (en) * 2017-11-07 2020-09-16 Editas Medicine, Inc. Targeted integration systems and methods for the treatment of hemoglobinopathies
CN110396523B (zh) * 2018-04-23 2023-06-09 中国科学院分子植物科学卓越创新中心 一种重复片段介导的植物定点重组方法
EP3942040A1 (en) * 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016073990A2 (en) * 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CN108124453A (zh) * 2015-03-31 2018-06-05 爱克莱根科技公司 用于将DNA序列靶向并入细胞或生物体的基因组中的Cas9逆转录病毒整合酶和Cas9重组酶系统
CN107686842A (zh) * 2016-08-03 2018-02-13 南京大学 一种靶多核苷酸编辑方法及其应用
WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
CN108192956A (zh) * 2017-11-17 2018-06-22 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
WO2020120711A1 (en) * 2018-12-12 2020-06-18 Depixus Method of nucleic acid enrichment using site-specific nucleases followed by capture
WO2020124257A1 (en) * 2018-12-21 2020-06-25 Tremblay Jacques P App modification via base editing using the crispr/cas9 system
CN111378051A (zh) * 2020-03-25 2020-07-07 北京市农林科学院 Pe-p2引导编辑系统及其在基因组碱基编辑中的应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ANDREW V ANZALONE等: "Search-and-replace genome editing without double-strand breaks or donor DNA", 《NATURE》, vol. 576, no. 7785, pages 149 - 151 *
CHENXIN WANG等: "High-efficiency targeted transgene integration via primed micro-homologues", 《CELL DISCOV》, vol. 9, no. 1, pages 69 *
PAUL T MANNA等: "Fast and cloning-free CRISPR/Cas9-mediated genomic editing in mammalian cells", 《TRAFFIC》, vol. 20, no. 12, pages 974 - 982, XP055885584, DOI: 10.1111/tra.12696 *
RUI TAO等: "WT-PE: Prime editing with nuclease wild-type Cas9 enables versatile large-scale genome editing", 《SIGNAL TRANSDUCT TARGET THER》, vol. 7, no. 1, pages 108 *
李文均、田野: "CRISPR/Cas工具――分子遗传研究的新刃", 《微生物学报》, no. 11, pages 1653 - 1664 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023029492A1 (zh) * 2021-09-03 2023-03-09 中国科学院动物研究所 一种外源基因定点整合的系统及方法
WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments

Also Published As

Publication number Publication date
EP4180460A1 (en) 2023-05-17
WO2022007959A1 (zh) 2022-01-13

Similar Documents

Publication Publication Date Title
CN106715694B (zh) 核酸酶介导的dna组装
CN113913405A (zh) 一种编辑核酸的系统及方法
WO2022253185A1 (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
US8815600B2 (en) Homologous recombination-based DNA cloning methods and compositions
CN109136248B (zh) 多靶点编辑载体及其构建方法和应用
JP6552969B2 (ja) 定方向進化のためのライブラリーの作製方法
WO2009110606A1 (ja) 相同組換え方法およびクローニング方法並びにキット
WO2002008408A2 (en) Modular vector systems
CN113564164B (zh) 一种提高先导编辑效率的载体和方法
JP6871544B2 (ja) 興味対象の配列を含む分子構成要素からdnaベクターを生産する方法
CN117384880A (zh) 工程化的核酸修饰编辑器
US8481306B2 (en) Methods for ligation independent cloning of DNA
CN107287226B (zh) 一种基于Cpf1的DNA构建物以及DNA体外拼接方法
EP2261332A2 (en) Libraries of recombinant chimeric proteins
WO2021081384A1 (en) Synthetic nucleases
CN117897481A (zh) 一种外源基因定点整合的系统及方法
MXPA01012406A (es) Vectores novedosos para mejorar la clonacion y expresion en plasmidos con bajo numero de copias.
CN114787347B (zh) 新颖的mad核酸酶
KR102302827B1 (ko) 크리스퍼 간섭을 이용한 유전자 발현 억제용 조성물
US20230272434A1 (en) Genomic editing with site-specific retrotransposons
WO2024017189A1 (en) Tnpb-based genome editor
WO2023150637A1 (en) Nucleic acid-guided nickase fusion proteins
JP2024509047A (ja) Crispr関連トランスポゾンシステム及びその使用方法
JP2024509048A (ja) Crispr関連トランスポゾンシステム及びその使用方法
WO2023183627A1 (en) Production of reverse transcribed dna (rt-dna) using a retron reverse transcriptase from exogenous rna

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination