CN116949039A - 基于crispr的成像标记系统及其用途 - Google Patents

基于crispr的成像标记系统及其用途 Download PDF

Info

Publication number
CN116949039A
CN116949039A CN202210413917.9A CN202210413917A CN116949039A CN 116949039 A CN116949039 A CN 116949039A CN 202210413917 A CN202210413917 A CN 202210413917A CN 116949039 A CN116949039 A CN 116949039A
Authority
CN
China
Prior art keywords
crispr
sgrna
leu
lys
expression vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210413917.9A
Other languages
English (en)
Inventor
宋春青
申恩志
吕欣原
邓远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine
Original Assignee
West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine filed Critical West Lake Laboratory Zhejiang Provincial Laboratory Of Life Sciences And Biomedicine
Priority to CN202210413917.9A priority Critical patent/CN116949039A/zh
Priority to PCT/CN2023/088712 priority patent/WO2023198216A1/en
Publication of CN116949039A publication Critical patent/CN116949039A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/06Linear peptides containing only normal peptide links having 5 to 11 amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/6456Spatial resolved fluorescence measurements; Imaging
    • G01N21/6458Fluorescence microscopy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种基于CRISPR的成像标记系统及其用途。所述成像标记系统包含:(1)dCas9表达载体或dCas9蛋白;(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;和(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接。该成像标记系统具有提高的分辨率,达到单拷贝非重复基因位点的成像标记,尤其是活细胞中单拷贝非重复基因位点的成像标记。

Description

基于CRISPR的成像标记系统及其用途
技术领域
本发明涉及一种基于CRISPR的成像标记系统及其用途。具体而言,本发明基于CRISPR的成像标记系统是一种基于CRISPR的原位杂交荧光放大系统,简称为CRISPRFISHer系统(CRISPR based fluorescent in situ hybridization amplifier system)。
背景技术
自人类基因组计划成功实施以来,生命科学领域取得了巨大进步,尤其是在分子生物学领域,人们对基因的复制、修复、转录和翻译等过程有了更深入的认识。而对这些重要生物过程的研究离不开基于DNA或RNA序列特异性或结构特异性成像技术的开发和运用。目前人们已经开发了多种成像技术(例如,荧光原位杂交等能够实现固定后细胞中的DNA成像和活细胞中含有重复序列的基因组位置成像),但是绝大多数基因序列是非重复序列(~65%)[1],它们在活细胞中的成像对于理解基因在染色中的行为学、如何参与转录调控等意义重大,但是由于技术限制,一直没有实现。
一传统的成像技术-荧光原位杂交(FISH)——标记内源性基因组位点
现如今,荧光原位杂交(FISH)技术已经被广泛的应用于生物学的基因标记中[2,3],该方法是利用荧光标记的特异核酸探针与细胞内相应的靶DNA分子杂交,进而确定结合了荧光探针的DNA区域的细胞内定位。然而,由于单个荧光分子的信号非常微弱,为了得到较高的分辨率,科学家们常常设计多个荧光探针并使之同时靶向目标位点中的多个相邻序列[4]。虽然FISH已经在基因标记中获得了广泛的应用,但是仍然存在很多问题。例如:1)该方法需要将细胞固定后进行观察,因此只能获得某一时刻的细胞定性状态;2)细胞固定后,DNA进行变性,染色质的结构状态很难保证完好无损。
二基于CRISPR/Cas的活细胞成像技术
随着CRISPR/Cas基因编辑技术的推广,科学家发现核酸酶失活形式的Cas9(DeadCas9,简称dCas9),仍能够与单个向导RNA(single guide RNA,简称sgRNA)相结合,并特异性的结合到与sgRNA互补的基因组序列[5],进而推动了基因组位点的活细胞成像技术。
(1)基于荧光蛋白的CRISPR成像系统
2013年陈宝惠等人[6]首次将dCas9与EGFP融合表达,借助靶向端粒重复序列的sgRNA引导,可以观察到端粒的基因组成像。陈宝惠等人首次将CRISPR系统应用于成像领域用于标记重复序列较多的端粒,并首次实现了活细胞基因成像标记[6]。但是,该系统分辨率只能标记类似端粒这样具有重复序列的位点,同时游离荧光标记的dCas9、EGFP或未结合靶点的dCas9-EGFP复合物的存在,不可避免地提高了背景信号。dCas9蛋白倾向于定位于核仁,一系列研究均已经观察到dCas9-EGFP在核仁中诱发的高背景信号[6,7]。很多科学家尝试使用dCas9-sun-tag系统(基于GCN4与scFv的相互作用)募集更多的与dCas9结合的荧光蛋白[8,9],但是这个系统的背景信号很高。
除了使用dCas9融合荧光蛋白,很多课题组将sgRNA加上RNA结合蛋白可以识别的结合功能区域,修饰后的sgRNA可以招募荧光蛋白和RNA结合蛋白的融合蛋白到基因组靶序列,进行实现基因组不同位点的标记[10-12]。其中应用最为广泛的sgRNA修饰是加上MS2配体,它是由噬菌体MS2 RNA病毒衍生而来的一种RNA茎环结构,可与MS2外壳蛋白(MCP)结合,具有很高的特异性和亲和力[13]。
2018年马涵慧等人[11]开发了CRISPR-Sirius成像系统,其在保持多色,灵活性等优点的基础上。将CRISPR成像系统的分辨率极限提高到了22个拷贝。但是提高信号/背景比,达到单拷贝的分辨率仍然是DNA活细胞成像中最关键的问题。
(2)基于有机染料的CRISPR-dCas9系统
与荧光蛋白相比,有机染料通常更明亮,更耐光性,尺寸更小。目前,三种基于染料的有机系统已经证明了在活细胞中可视化基因组位点的可行性。它们包括基于Halo标签的系统、基于RNA配体的系统和基于分子信标(molecular beacon)的系统。首先,在Halo标签系统中,dCas9可以同Halo标签相融合,Halo标签是细菌卤代烷烃脱卤酶的突变体,可以共价结合到Halo标签配体上,Halo标签配体是一种细胞可渗透的氯代烷烃分子,可以通过化学方式附着到选择的染料上[14]。其次,基于RNA配体的系统使用以3,5-二氟-4-羟基苄基咪唑啉酮(DFHBI)为基础的染料,这是一种活性染料,在生理条件下猝灭,但与同源RNA核酸配体结合时会发出荧光[15]。其标记原理同Halo标签系统相似。然而,这两个系统的信号/背景的相对值较低,因此不能进行分辨率更高的标记。
为了进一步提高信号/背景比,科学家们开发了MBs CRISPR/dCas9系统,MBs是一类可猝灭的荧光寡核苷酸探针,与互补的核酸靶标结合后激活荧光[16],但是对于基因组的非重复序列的特异性荧光标记还是很难实现的。
(3)基于纳米颗粒的CRISPR-dCas9系统
量子点(QD)是一种发光的半导体纳米粒子,尺寸为50-100纳米,具有优于合成染料和荧光蛋白的亮度和光稳定性,然而,作为一类合成纳米材料,量子点同样具有同合成染料相似的局限性,例如,量子点由于体积大,很难进行有效的递送[17]。
三基于CRISPR-Cas9系统的成像技术目前存在的问题
尽管基于CRISPR-Cas9系统在活体细胞成像领域取得了巨大进展,但仍有许多挑战需要克服。
(1)低信号/背景比,低分辨率(仍然存在很强的背景信号)
为了提高信号与背景的比值,科学家一直致力于通过dCas9或sgRNA的荧光标记来增加信号。由于游离荧光标记的dCas9、sgRNA或未结合靶点的dCas9-sgRNA复合物的存在,这不可避免地提高了背景信号。据推测,减少背景信号可能需要更复杂的成像方法,如荧光共振能量转移(FRET),它已被用于RNA和蛋白质的无背景成像[18,19]。
(2)对于非重复序列的成像标记仍然难以实现
相比于只需要一条sgRNA就可以实现成像的重复序列来说,非重复序列可能需要多条不同的sgRNA同时靶向,想要实现是非常困难的。现阶段的研究包括将多条sgRNA克隆到由gRNA oligos(CARGO),简化转染过程,提高转染效率。尽管有了这些进展,在一个细胞中同时表达多个不同sgRNA物种仍然是困难的,因为RNA的转录率经常表现出跳动变化[20,21]。因此,多个sgRNA的生产可能彼此“不同步”。为了增加不同sgRNA的共表达,一种可能的策略是在一个转录本中构建一个表达载体,每两个sgRNA由一个基质连接,基质可以被RNA酶切除。tRNA是这种底物的候选物质之一[22]。即使所有不同的sgRNA可以同时表达,非重复序列的成像仍然具有挑战性,因为不同的sgRNA可能会相互竞争结合dCas9,仍不能达到信号放大的目的。
因此,对于能够提高成像系统的分辨率、尤其是达到单拷贝非重复基因位点成像标记的系统和方法存在需求。
发明内容
本发明的目的是提高成像系统的分辨率,达到单拷贝非重复基因位点的成像标记。
在一方面中,本发明提供一种基于CRISPR的成像标记系统(全称为基于CRISPR的原位杂交荧光放大系统(CRISPR based fluorescent in situ hybridization amplifiersystem),简称CRISPR FISHer系统),该成像标记系统能够提高成像系统的分辨率,达到单拷贝非重复基因位点的成像标记,尤其是活细胞中单拷贝非重复基因位点的成像标记。
本发明的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接且连接方式不固定,可根据实际需要选择最佳连接方式。
在一个实施方案中,在所述CRISPR FISHer系统中,dCas9表达载体或dCas9蛋白可以用稳定表达dCas9蛋白的细胞系替换。所述dCas9如SEQ ID No:1所示。
本发明所述的改造的sgRNA并没有改变与dCas9结合的序列,改造的是sgRNA的茎环部分,在其中插入RNA适配体序列。
在一个实施方案中,所述改造的sgRNA表达载体由U6启动子驱动,其可以是鼠源U6启动子(mU6)或人源U6启动子(hU6);
RNA适配体位于sgRNA骨架茎环(即,sgRNA scaffold)中,所述RNA适配体可以选自,但不限于:PP7、MS2或BoxB;
n个RNA适配体表示n个RNA适配体串联连接,可以通过接头连接,也可以直接连接。在通过接头连接时,所述接头可以从本领域常用的接头中选择。其中n为大于或等于2的整数,例如,可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值;
多聚化肽段可以选自,但不限于,foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,其中foldon由SEQ ID No:10所示的氨基酸序列组成;
其中融合蛋白中的RNA结合基序特异性识别改造的sgRNA表达载体中的RNA适配体,即,RNA适配体与RNA结合基序是配对的,因此融合蛋白中的RNA结合基序可以是,但不限于:识别PP7的PCP、识别MS2的MCP或识别BoxB的N22;其中PCP、MCP和N22的氨基酸序列分别如SEQ ID No:14、15、16所示;换言之,在本发明的基于CRISPR的成像标记系统中,所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
融合蛋白中的荧光蛋白可以选自,但不限于:绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)、蓝色荧光蛋白(BFP)等。
根据实际应用的需要,本领域技术人员容易选择适当的质粒用来构建(1)至(3)的表达载体。可用的质粒包括,但不限于PX330、pUR和慢病毒lenti等。
在一个实施方案中,在融合蛋白表达载体中,多聚化肽段可以融合在荧光蛋白的N端或C端,或位于融合蛋白的N端或C端,优选地,多聚化肽段位于融合蛋白的N端。例如,从N端至C端,所述融合蛋白的结构可以是:RNA结合基序-多聚化肽段-荧光蛋白,RNA结合基序-荧光蛋白-多聚化肽段,多聚化肽段-RNA结合基序-荧光蛋白或多聚化肽段-荧光蛋白-RNA结合基序。
在一个实施方案中,融合蛋白表达载体中还包含核定位序列(NLS),所述核定位序列(NLS)可以位于融合蛋白的N端或C端。
在一个实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-n×PP7所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,PP7是所选的RNA适配体,n×PP7表示n个PP7串联插入在sgRNA骨架茎环中,其中n为大于或等于2的整数,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为foldon-荧光蛋白-PCP或PCP-foldon-荧光蛋白。
其中n可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值;荧光蛋白可以依据实际需要选择,例如,绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)等。
在一个具体的实施方案中,n为2或8。
在一个具体的实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-2×PP7所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,PP7是所选的RNA适配体,2×PP7表示2个PP7串联插入在sgRNA骨架茎环中,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为foldon-荧光蛋白-PCP。
在一个具体的实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-8×PP7所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,PP7是所选的RNA适配体,8×PP7表示8个PP7串联插入在sgRNA骨架茎环中,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为foldon-荧光蛋白-PCP。
在一个具体的实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-8×PP7所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,PP7是所选的RNA适配体,8×PP7表示8个PP7串联插入在sgRNA骨架茎环中,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为PCP-foldon-荧光蛋白。
在一个实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-n×MS2所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,MS2是所选的RNA适配体,n×MS2表示n个MS2串联插入在sgRNA骨架茎环中,其中n为大于或等于2的整数,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为foldon-荧光蛋白-MCP或MCP-foldon-荧光蛋白。
其中n可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值;荧光蛋白可以依据实际需要选择,例如,绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)等。
在一个具体的实施方案中,n为2或8。
在一个实施方案中,本发明所述的基于CRISPR的成像标记系统包含:
(1)dCas9表达载体或dCas9蛋白,
(2)改造的sgRNA表达载体,所述改造的sgRNA具有U6-sgRNA-n×BoxB所示的结构,其中U6是启动子,sgRNA是特异性针对待检测的靶基因的向导RNA,所述sgRNA能够与dCas9结合,BoxB是所选的RNA适配体,n×BoxB表示n个BoxB串联插入在sgRNA骨架茎环中,其中n为大于或等于2的整数,和
(3)融合蛋白表达载体,所述融合蛋白从N端到C端为foldon-荧光蛋白-N22或N22-foldon-荧光蛋白。
同样地,其中n可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值;荧光蛋白可以依据实际需要选择,例如,绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)等。
在一个具体的实施方案中,n为2或8。
在另外的实施方案中,融合蛋白表达载体中的多聚化肽段foldon可以被GCN4、3HB或6G6H替换。
在另外的实施方案中,在融合蛋白表达载体中,多聚化肽段foldon、GCN4、3HB或6G6H可以融合在荧光蛋白的N端或C端,或位于整个融合蛋白的N端或C端,优选地位于整个融合蛋白的N端。
本领域技术人员能够理解,用于构建dCas9表达载体、改造的sgRNA表达载体和融合蛋白表达载体的质粒没有特别的限制,本领域技术人员能够选择合适的质粒来构建这些表达载体。例如,用于构建sgRNA-n×PP7表达载体的质粒可参见Addgene网站,例如,可以使用编号为#121943的质粒。
针对本发明的基于CRISPR的成像标记系统,需要说明的是:
1)改造的sgRNA表达载体中的RNA适配体与融合蛋白中的RNA结合基序配对,以实现RNA结合基序对RNA适配体的特异性识别。可以使用的RNA适配体和RNA结合基序的组合为:PP7和PCP,MS2和MCP,或BoxB和N22,其他类似的RNA适配体和RNA结合基序的组合也可以用于本发明的基于CRISPR的成像标记系统。
2)对于dCas蛋白元件,可以使用CMV启动子、EF1a启动子等常规持续启动dCas9蛋白的表达,或者使用诱导型启动子启动dCas9的特异性表达等。本领域技术人员能够选择适当的启动子。
3)多聚化肽段不限于foldon三聚体小肽,也可以使用GCN4(三聚体)、3HB(三聚体)、6G6H(六聚体)等,这些多聚化肽段能够使包含多聚化肽段的融合蛋白以多聚体形式存在。
4)sgRNA的启动子可以是鼠源U6启动子(mU6)或人源U6启动子(hU6)。
5)对于用于构建本发明所述的基于CRISPR的成像标记系统中的相关表达载体的质粒没有特别限制,本领域技术人员根据实际应用的需要能够容易地选择合适的质粒。
本发明所述的基于CRISPR的成像标记系统中的相关元件的氨基酸或核苷酸序列如下:
dCas9(SEQ ID No:1)
sgRNA-8×PP7(SEQ ID No:2)
其中NNNNNNNNNNNNNNNNNNNN表示sgRNA靶向序列,下同。下划线的序列是PP7的茎环结构序列。
sgRNA-2×PP7(SEQ ID No:3)
其中下划线的序列是PP7的茎环结构序列。
sgRNA-8×MS2(SEQ ID No:4)
其中下划线的序列是MS2的茎环结构序列。
sgRNA-2×MS2(SEQ ID No:5)
其中下划线的序列是MS2的茎环结构序列。
sgRNA-8×BoxB(SEQ ID No:6)
其中下划线的序列是BoxB的茎环结构序列。
sgRNA-2×BoxB(SEQ ID No:7)
其中下划线的序列是BoxB的茎环结构序列。
mU6启动子(SEQ ID No:8)
hU6启动子(SEQ ID No:9)
Foldon(SEQ ID No:10)
GCN4(SEQ ID No:11)
3HB(SEQ ID No:12)
6G6H(SEQ ID No:13)
PCP(SEQ ID No:14)
MCP(SEQ ID No:15)
N22(SEQ ID No:16)
sgRNA-3×PP7(SEQ ID No:17)
其中下划线的序列是PP7的茎环结构序列。
sgRNA-4×PP7(SEQ ID No:18)
其中下划线的序列是PP7的茎环结构序列。
sgRNA-5×PP7(SEQ ID No:19)
其中下划线的序列是PP7的茎环结构序列。
sgRNA-6×PP7(SEQ ID No:20)
其中下划线的序列是PP7的茎环结构序列。
sgRNA-7×PP7(SEQ ID No:21)
其中下划线的序列是PP7的茎环结构序列。
除了上述包含各个元件的表达载体的CRISPR FISHer系统之外,本发明的CRISPRFISHer系统可以包含dCas9蛋白以替换相应的dCas9表达载体形式。所述dCas9蛋白可以通过将相应的dCas9表达载体转化到宿主细胞中进行重组表达并纯化得到,可用的宿主细胞可以包括,但不限于:细菌细胞、真菌细胞、昆虫细胞或哺乳动物细胞等,例如,常用的大肠杆菌细胞或酵母细胞等。另外,dCas9蛋白也可以商购获得。备选地,本发明的基于CRISPR的成像标记系统中的dCas9表达载体或dCas9蛋白也可以用稳定表达dCas9蛋白的细胞系替换。
例如,本发明的CRISPR FISHer系统包含:
(1)dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接且连接方式不固定,可根据实际需要选择最佳连接方式。
其中,上述元件各部分的定义可参考上文。具体而言,所述dCas9如SEQ ID No:1所示;RNA适配体位于sgRNA骨架茎环(即,sgRNA scaffold)中,所述RNA适配体可以选自,但不限于:PP7、MS2或BoxB,并且,所述融合蛋白中的RNA结合基序特异性识别改造的sgRNA表达载体中的RNA适配体,即,RNA适配体与RNA结合基序是配对的,因此融合蛋白中的RNA结合基序可以是,但不限于:识别PP7的PCP、识别MS2的MCP或识别BoxB的N22;其中PCP、MCP和N22的氨基酸序列分别如SEQ ID No:14、15、16所示;换言之,在本发明的基于CRISPR的成像标记系统中,所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
n个RNA适配体表示n个RNA适配体串联连接,可以通过接头连接,也可以直接连接。在通过接头连接时,所述接头可以从本领域常用的接头中选择。其中n为大于或等于2的整数,例如,可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值。
多聚化肽段可以选自,但不限于,foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,其中foldon由SEQ ID No:10所示的氨基酸序列组成。
融合蛋白中的荧光蛋白可以选自,但不限于:绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、红色荧光蛋白(RFP)、蓝色荧光蛋白(BFP)等。
在一个实施方案中,所述融合蛋白还包含核定位序列(NLS),所述核定位序列(NLS)可以位于融合蛋白的N端或C端。
本发明的CRISPR FISHer系统能够实现单拷贝基因的成像标记的是基于CRISPR/荧光系统在基因靶点附近聚集。例如,以包含PP7/PCP(分别作为RNA适配体和RNA结合基序)和GFP(作为荧光蛋白)的本发明的CRISPR FISHer系统为例,示意性说明成像标记聚集的形成过程:
(1)首先,Foldon-GFP-PCP融合蛋白能够自发形成蛋白三聚体(图4A),其次PCP可以与PP7特异性结合,即Foldon-GFP-PCP融合蛋白会与改造的sgRNA中的PP7元件特异性结合。
(2)具体的聚集过程如下:
sgRNA首先与dCas9蛋白结合形成复合物,然后dCas9/sgRNA复合物结合到sgRNA靶标的DNA序列处,随后sgRNA骨架茎环处的PP7能够招募三聚体化的Foldon-GFP-PCP融合蛋白。
而三聚化的Foldon-GFP-PCP融合蛋白由于有三个PCP结构域,因此除了结合dCas9/sgRNA复合物上的PP7外还能与其它改造的sgRNA的骨架茎环处的PP7相结合。而其它改造的sgRNA又会招募更多的三聚化的Foldon-GFP-PCP融合蛋白。因此,本发明的CRISPRFISHer系统会通过sgRNA与三聚化的Foldon-GFP-PCP融合蛋白反复招募和结合而最终会形成sgRNA-PP7-Foldon-GFP-PCP的聚集。此聚集体中含有多个GFP荧光基团,从而实现荧光信号的N倍数放大(N大于等于10)(图8B)。
(3)多个sgRNA和绿色荧光蛋白GFP都会在目标序列周围聚集,从而极大的增加了该CRISPR FISHer系统的分辨率和信号/背景比,最终达到只利用一个sgRNA即可成功地标记成像单拷贝基因位点的效果。
在一个实施方案中,构建的Foldon-GFP-PCP和PCP-foldon-GFP片段的氨基酸序列如下:
Foldon-GFP-PCP(SEQ ID No:22,斜体表示Foldon,下划线表示GFP,波浪线表示PCP)
PCP-foldon-GFP(SEQ ID No:23,斜体表示Foldon,下划线表示GFP,波浪线表示PCP)
本发明的CRISPR FISHer系统能够极大地提高分辨率和信号/背景比(S/B比),同时能够实现单拷贝基因的靶向成像标记。
本发明首先检测了dCas9、PCP-foldon-GFP与改造的sgRNA的蛋白/RNA复合物可以在sgRNA靶向DNA位点处形成聚集,其他有类似效果的RNA适配体和RNA结合基序组合理论上都可用于本发明。固定sgRNA靶向位点的上述复合体使GFP蛋白可以在靶标位点聚集,从而达到利用单个sgRNA靶向单拷贝位点的可视化标记的目的。
在第二方面中,本发明提供一种基于CRISPR的靶基因成像标记方法,所述方法包括:
(i)构建本发明第一方面所述的CRISPR FISHer系统,所述CRISPR FISHer系统包含:
(1)dCas9表达载体;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接,且其连接方式不固定,可根据实际需要选择最佳方式连接;
(ii)细胞转染:用所述CRISPR FISHer系统中的各个表达载体转染待检测的细胞;
(iii)使用共聚焦显微镜观察由所述CRISPR FISHer系统形成的聚集点。
其中细胞转染方法是能将外源DNA序列导入到细胞中的常规转染方法,包括利用质粒或慢病毒,借助LT1、Lipo2000、PEI等转染试剂进行转染,和电转方法等。
由于CRISPR FISHer系统形成的信号聚集点,增强了被标记的靶基因的信号,使用本领域的普通共聚焦显微镜便可进行观察和拍照。
在一个实施方案中,在所述CRISPR FISHer系统中,dCas9表达载体可以用稳定表达dCas9蛋白的细胞系(例如,转染了dCas9表达载体的细胞系)替换。所述dCas9如SEQ IDNo:1所示。
在一个实施方案中,所述CRISPR FISHer系统可以包含dCas9蛋白以替换相应的dCas9表达载体形式。例如,在本发明的CRISPR FISHer系统中,可以用dCas9蛋白替换dCas9蛋白表达载体。所述dCas9蛋白或融合蛋白可以通过将各自对应的表达载体转化到宿主细胞中进行重组表达并纯化得到,可用的宿主细胞可以包括,但不限于:细菌细胞、真菌细胞、昆虫细胞或哺乳动物细胞等,例如,常用的大肠杆菌细胞或酵母细胞等。另外,dCas9蛋白也可以商购获得。
例如,本发明的CRISPR FISHer系统包含:
(1)dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接且连接方式不固定,可根据实际需要选择最佳连接方式。
其中,各元件的定义参见本文第一方面对各元件的定义。
在一个实施方案中,所述融合蛋白还包含核定位序列(NLS),所述核定位序列(NLS)可以位于融合蛋白的N端或C端。
当所述CRISPR FISHer系统包含蛋白形式的dCas9元件时,靶基因成像标记方法包括下述步骤:
(i)细胞转染:将CRISPR FISHer系统中所包含的dCas9蛋白、sgRNA表达载体和融合蛋白表达载体转染到(例如,通过电转)待检测的细胞中;
(ii)使用共聚焦显微镜观察由所述CRISPR FISHer系统形成的聚集点。
在一个实施方案中,本发明所述的基于CRISPR的基因成像标记方法可以用于活细胞中单拷贝基因的成像标记。
在一个实施方案中,本发明所述的基于CRISPR的基因成像标记方法可以用于活细胞中多拷贝基因的成像标记。
在一个实施方案中,本发明所述的基于CRISPR的基因成像标记方法可以用于活细胞中染色体DNA之上或之外的非重复区的成像标记。
在一个实施方案中,本发明所述的基于CRISPR的基因成像标记方法可以用于活细胞中染色质外环状DNA元件(eccDNA)的成像标记。
在一个实施方案中,本发明所述的基于CRISPR的基因成像标记方法可以用于CRISPR结合位点的区域成像标记,不限于基因组,例如位于染色体外的环状DNA(eccDNA)、外源表达的质粒、乙肝病毒HBV基因序列和腺相关病毒(AAV)的双链AAV DNA也可以清晰成像。
在第三方面中,本发明提供一种基于CRISPR的基因成像标记试剂盒,所述试剂盒包含:
(1)dCas9表达载体;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接,其连接顺序不固定,可根据实际需要选择最佳连接顺序;
其中所述dCas9表达载体、改造的sgRNA表达载体和融合蛋白表达载体各自存放在单独的容器中。
在一个实施方案中,dCas9表达载体可以用稳定表达dCas9蛋白的细胞系替换。
在一个实施方案中,所述试剂盒可以包含dCas9蛋白以替换相应的dCas9表达载体形式。例如,所述试剂盒包含:
(1)dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接且连接方式不固定,可根据实际需要选择最佳连接方式;
其中所述dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体各自存放在单独的容器中。
在一个实施方案中,所述改造的sgRNA表达载体由U6启动子驱动,其可以是鼠源U6启动子(mU6)或人源U6启动子(hU6);
RNA适配体位于sgRNA骨架茎环(即,sgRNA scaffold)中,所述RNA适配体可以选自,但不限于:PP7、MS2或BoxB;
n个RNA适配体表示n个RNA适配体串联连接,可以通过接头连接,也可以直接连接,所述接头可以从本领域常用的接头中选择,其中n为大于或等于2的整数,例如,可以是2、3、4、5、6、7或8或更大的整数,其上限没有特别限制,本领域技术人员可以根据实际需要选择合适的n的取值;
多聚化肽段可以选自,但不限于,foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,其中foldon由SEQ ID No:10所示的氨基酸序列组成;
其中融合蛋白中的RNA结合基序特异性识别改造的sgRNA表达载体中的RNA适配体,即,RNA适配体与RNA结合基序是配对的,因此融合蛋白中的RNA结合基序可以是,但不限于:识别PP7的PCP、识别MS2的MCP或识别BoxB的N22;其中PCP、MCP和N22的氨基酸序列分别如SEQ ID No:14、15、16所示;换言之,在本发明的基于CRISPR的成像标记系统中,所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
融合蛋白中的荧光蛋白可以选自,但不限于:绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)、蓝色荧光蛋白(BFP)等。
在一个实施方案中,所述融合蛋白还包含核定位序列(NLS),所述核定位序列(NLS)可以位于融合蛋白的N端或C端。
以上内容是一个概述,因此必要时包含细节的简化、概括和省略。因此,本领域技术人员将认识到,该概述仅是举例说明性的,并不意图以任何方式进行限制。本文所述的方法、编辑文库和/或其他主题的其它方面、特征和优势将在本文所示的教导中变得明显。提供概述以简化地介绍一些选择的概念,这些概念将在下面的详细描述中进一步描述。本概述不旨在确定所要求保护的主题的关键特征或基本特征,也不旨在用作确定所要求保护的主题的范围的辅助手段。此外,贯穿本申请引用的所有参考文献、专利和公开的专利申请的内容通过引用整体并入本文。
附图说明
通过参考下面的附图,本领域技术人员将更容易理解本发明的技术方案。这些附图形成本发明的一部分。
图1显示foldon元件和GFP融合构建体在293T细胞中表达12小时的荧光。可以看出,无论是对照组(左列,只有GFP)还是实验组(中列和右列,foldon分别融合在GFP的N端或C端,GGS示意性表示接头序列),在转染后12小时时,荧光强度均已经达到近饱和状态。
图2显示GFP蛋白质印迹非变性凝胶检测结果。其中GGS示意性表示接头序列。可以看到,相比于对照组的GFP(野生型,左侧泳道),无论在GFP的N端(中间泳道)还是C端(右侧泳道)融合foldon元件,均可以发生GFP的三聚化,但是在GFP N端融合foldon的三聚化效果相对C端融合更强。
图3显示本发明实施例1制备的其中一个CRISPR FISHer系统版本(dCas9,sgRNA-8×PP7,PCP-foldon-GFP)的各元件的结构示意图和作用模式示意图。
图4显示纯化的PCP-GFP和foldon-GFP-PCP蛋白在变性(A,SDS-PAGEgel)和非变性(B,Native gel)条件下的电泳分离的条带,结果显示相比于对照组PCP-GFP,foldon-GFP-PCP可以发生三聚化(B);PCP-GFP或foldon-GFP-PCP与sgRNA(包括正常的sgRNA(即,不包含PP7)或包含n个PP7的改造的sgRNA,n为1-8的整数)温育得到的代表性荧光显微镜照片(C);室温孵育后每15250μm2个体聚集物的统计学分布(D);可能的组装模型示意图(E)。
图5显示Foldon-GFP-PCP能够允许CRISPR FISHer系统实现稳健的基因组基因座追踪,信号/背景比(S/B比)提高。
(A)CRISPR FISHer系统(dCas9、sgRNA-2×PP7和Foldon-GFP-PCP版本)在靶位点聚集的过程的模式图。sgRNA首先与dCas9蛋白结合形成复合物,然后dCas9/sgRNA复合物结合到sgRNA靶标的DNA序列处,随后sgChr3Rep-2×PP7上露出来的PP7序列招募三聚体化的Foldon-GFP-PCP融合蛋白,并在Chr3q29(~500个拷贝,Chr3Rep)处聚集。
(B)检测在dCas9-mCherry标记的Chr3Rep基因座处富集的foldon-GFP-PCP。白色箭头指示Chr3Rep基因位点。荧光成像结果显示Foldon-GFP-PCP聚集点在转染后4小时出现,其与Chr3Rep基因座共定位并且逐渐变得更亮、更清楚。该结果表明靶DNA-结合的dCas9/sgChr3Rep招募foldon-GFP-PCP至靶向基因座,同时增强靶位点的GFP信号并降低非特异性背景。
(C)在用foldon-GFP-PCP表达载体、dCas9-mCherry表达载体和sgChr3Rep-2×PP7表达载体共转染的U2OS细胞、HeLa细胞和HepG2细胞中,比较foldon-GFP-PCP(绿色)和dCas9-mCherry(红色)对Chr3Rep基因座的标记。在转染后24小时检测共定位,这表明在转染后24小时,foldon-GFP-PCP与dCas9-mCherry共定位。
(D)在U2OS细胞中比较foldon-GFP-PCP、PCP-GFP和dCas9-EGFP标记的端粒基因座。(E和F)比较用foldon-GFP-PCP、PCP-GFP和dCas9-EGFP标记的端粒基因座的信号/背景比(S/B比)。
(E)数据以平均值±SEM表示:dCas9-EGFP(2.056±0.385,n=21),PCP-GFP(1.849±0.385,n=20),foldon-GFP-PCP(18.579±4.515,n=23)。实验组的S/B比最高可以达到对照组的10倍。
(F)显示基于(E)中的信号/背景比(S/B)的S/B增强。
在此版本的CRISPR FISHer系统中,n.s.表示非显著性,***表示P<0.001(Wilcoxon检验)。标尺为5μm。
图6显示实验组(有foldon)和对照组(无foldon)在相同的转染条件下标记端粒的GFP荧光成像结果(A)以及荧光强度(B)和实验组细胞3D成像结果(C)。
(A)显示foldon和GFP融合构建体在293T细胞中靶向端粒(telomere)重复序列表达12小时的荧光。可以看出,含有PCP-foldon-GFP组荧光强度明显高于对照组(PCP-GFP)。靶向端粒的sgRNA选择8×PP7(sgTelomere-8×PP7);sgNT没有靶向序列,不能定位到染色体上。
(B)为代表性靶向位点的荧光强度值对比。
(C)实验组细胞3D成像结果。
图7显示实验组和对照组在相同的转染条件下标记单拷贝TOP3基因的GFP荧光检测结果。其中左起前两列为实验组,表达dCas9、sgTOP3-8×PP7和PCP-foldon-GFP,利用CRISPR FISHer系统标记单拷贝基因TOP3在染色体复制和未复制时的位置。第五列在前两列基础上外源转入了TOP3基因上的一段序列作为sgRNA的靶向序列,可以看到绿色荧光的信号点明显增多。第三列第四列为第五列的对照组,表达dCas9、sgTOP3-8×PP7、PCP-foldon-GFP和空T载体(T vector)。最后一列利用dCas9、sgTOP3-8×PP7和PCP-GFP表达系统作为对照,说明CRISPR FISHer系统相比于现有系统可以高灵敏地实现单拷贝基因的成像标记。
图8显示基于Foldon-GFP-PCP的CRISPR FISHer系统可以成像标记染色体DNA之上或之外的非重复序列。
(A)U2OS细胞中PPP1R2单拷贝基因非重复区域的成像标记结果,上部显示PCP-GFP组(弥散的绿色荧光信号)和Foldon-GFP-PCP组(2-4个绿色荧光信号点)分别标记PPP1R2的代表性图像。下部显示上部具有代表性的PPP1R2位点在z截面上的分布。
(B)CRISPR FISHer系统结合sgRNA-2×PP7靶向某基因位点的模拟图。
(C)U2OS细胞中PPP1R2(GFP)和3号染色体的重复序列区域(Chr3Rep)(tdTomato)位点的双色CRISPR成像示意图。Chr3Rep与非重复性PPP1R2位点之间的距离约为15kb。
(D和E)单拷贝基因PPP1R2的CRISPR FISHer和传统CRISPR-Sirius标记比较(绿色信号)。sgPPP1R2.1-2×PP7或sgPPP1R2.1-8×PP7用于靶向PPP1R2基因。在(D)中,红色标记的Chr3Rep作为参照,其表达系统为Chr3Rep-2×MS2、dCas9和stdMCP-tdTomato;BFP与NLS融合表明细胞核以及sgRNA-PP7转染。左边的虚线标记了产生右侧荧光强度值的区域。(E)比较基于CRISPR FISHer(Foldon-GFP-PCP)和传统CRISPR-Sirius(PCP-GFP)的信号/背景比。通过T检验表明,Foldon-GFP-PCP相比于PCP-GFP标记单拷贝基因的信号/背景比有显著的升高(P<0.001***)。
(F和G)U2OS细胞中PPP1R2基因(绿色)、Chr3Rep(红色)和Chr13Rep(紫色)位点的三色CRISPR成像。(F)为目标位点示意图。(G)为荧光标记图,左边的虚线标记了产生右侧荧光强度值的区域。
(H和I)利用CRISPR FISHer在U2OS细胞中成像标记TOP3或TOP1单拷贝基因。stdMCP-tdTomato标记的Chr3Rep(红色)作为参照。其中TOP3位于17号染色体,TOP1位于21号染色体。(H)代表目标位点示意图。(I)为荧光标记图,左边的虚线标记了产生右侧荧光强度值的区域,虚线贯穿选定的红色和绿色荧光信号点,右侧对应其荧光强度值。
(J)利用CRISPR FISHer系统在Hep3B细胞系中检测HBV整合至基因组中,使用sgGal4作为对照(弥散的绿色荧光信号),使用sgHBV的CRISPR FISHer系统靶向S蛋白显示绿色圆点,表明Hep3B中存在HBV病毒。
(K)统计30个Hep3B细胞中绿色荧光信号点的个数,代表HBV的拷贝数。
图9显示CRISPR FISHer系统追踪CRISPR诱导的DNA双链断裂(DSB)和非同源性末端接合修复的结果。
(A)对同一个染色体内DSB断裂位点的两端标记,诱导DSB后,标记的染色体片段进行染色体内断裂和重新连接的示意图。首先利用CRISPR-Sirius系统标记3号染色体的重复序列区域(红色),CRISPR FISHer标记PPP1R2基因(绿色)。16小时后,转染SaCas9以及其对应sgRNA(切割红色和绿色标记位点的中间区域)。
(B)显示一个单细胞中代表性DSB引起染色体断裂和重新连接的荧光标记图。白框显示不同的DNA位点。
(C和D)显示(B)中第1对DNA位点的不同时间点的成像标记荧光图和定量距离,可以看出60min时红色信号点和绿色信号点分离,而后逐渐靠近最后完全重合,这表明染色体发生断裂以及重新修复的过程。
(E和F)显示(B)中第2、3对DNA位点的不同时间点的成像标记荧光图和定量距离,可以看出上述2位点各自发生断裂以及修复后,又逐渐出现染色体间的重新连接。
(G)显示Chr3和Chr13之间的染色体重组示意图。其标记策略同11F相同。SaCas9/sgRNA用于在Chr3上的标记位点和Chr13上的SPACA7基因之间产生DNA切割(在标记系统递送16h后进行递送)。
(H)显示Chr3和Chr13之间的染色体断裂和染色体间易位的不同时间点的成像标记荧光图。其中白色框显示局部放大图。可以看出,前60min红色和绿色的荧光信号点分离,表明靶向3号染色体的SaCas9已经完成了切割,75min时绿色的荧光信号和粉色的荧光信号完全重合,表明此时又已经发生了3号染色体长臂和13号染色体短臂的易位。
(I)显示(H)中DNA位点的距离。红色线表示Chr3Rep与PPP1R2位点的距离;紫色线表示Chr13Rep与PPP1R2之间的距离。
图10显示CRISPR FISHer能够实时跟踪活细胞中的染色体外DNA动态位置。
(A)显示在HepG2中鉴定eccDNA的策略流程。
(B)显示在HepG2细胞中鉴定出的三个代表性eccDNA的连接处序列信息。
(C)显示CRISPR FISHer标记的eccDNA的策略示意图。
(D)利用CRISPR FISHer标记的eccDNA的代表性图像。sgGal4作为对照sgRNA呈现弥撒的绿色荧光信号。
(E)显示在HepG2细胞中四种eccDNA个数的统计结果。
(F)显示Chr3Rep、PPP1R2和eccBEND3在5min的运动轨迹图。
(G)显示Chr3Rep、PPP1R2和eccBEND3的轨迹长度统计,通过T检验表明,eccDNA的运动轨迹长度相比于染色体和染色体上的有显著的升高(P<0.001***)。可以看出eccDNA作为染色体外DNA其运动的方式同染色体以及染色体上的基因存在很大的差异,这可能与其特定的生理功能相关联。
(H)显示线性化eccDNA的扩增及标记策略。
(I)显示线性化eccBEND3,eccPRKCB,eccGABRR1在5min的运动轨迹图。
(J)显示环状eccDNA和线性化eccDNA的5min运动轨迹长度比较统计图。
(K)显示CRISPR FISHer标记的eccDNA的策略示意图。
(L和M)显示U2OS细胞中用CRISPR FISHer标记的细胞核中双链腺相关病毒(AAV)DNA位点。(M)在单个活细胞中,随着时间的推移,双链AAV DNA荧光标记点出现并逐渐增多。
(N)显示U2OS细胞核AAV在5min的运动轨迹图。
(O)显示U2OS细胞核AAV在5min的运动轨迹长度统计。
图11显示三聚体foldon-GFP-PCP使CRISPR FISHer系统能够在多种细胞系中标记重复序列。
(A)显示双色CRISPR系统成像表明foldon-GFP-PCP(绿色)和dCas9-mCherry(红色)在U2OS、HeLa和HepG2细胞中多拷贝位点Chr13Rep呈现共定位。标尺为5μm。
(B)显示图5D中端粒成像Z轴扫描的单层代表图。
图12显示人类基因组中不同染色体上重复序列的分布情况。
图13显示foldon-GFP-PCP(绿色)在不同对照组中的信号特征。上部分为foldon-GFP-PCP绿色通道与Hoechest蓝色通道叠加的图像,中间和下部分分别为绿色通道与蓝色通道的图像。从左往右数第一列转染了foldon-GFP-PCP;第二列转染了普通结构的sgPPP1R2.1和foldon-GFP-PCP;第三列转染了经改造增加了2个PP7的sg PPP1R2.1和foldon-GFP-PCP;第四列转染了foldon-GFP-PCP和dCas9;第五列转染了普通结构的sgPPP1R2.1,foldon-GFP-PCP和dCas9;第六列转染了在细胞中无靶标序列经改造增加了2个PP7的sgGal4。Hoechest用于染色细胞核。标尺为5μm。
图14显示CRISPR-FISHer系统在U2OS细胞中标记基因PPP1R2中非重复序列位点的结果图。
(A)显示双色CRISPR系统CRISPR-FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中标记单拷贝基因位点PPP1R2和多拷贝位点Chr3Rep呈现共定位示意图。
(B)显示使用CRISPR-FISHer(绿色)配合含有2×PP7和8×PP7的sgRNA标记单拷贝基因位点PPP1R2与CRISPR-Sirius(红色)标记重复序列位点Chr3Rep共定位结果图。
(C)显示使用CRISPR-Sirius(PCP-GFP)系统配合8×PP7的sgRNA标记单拷贝基因位点PPP1R2的结果图。标尺为5μm。
图15显示使用CRISPR FISHer(绿色)系统在Hela和HepG2细胞中标记单拷贝基因位点PPP1R2的结果图。CRISPR-Sirius(红色)用于标记重复序列位点Chr3Rep。标尺为5μm。
图16显示使用CRISPR FISHer(绿色)系统标记细胞中非重复基因位点。
(A)显示双色CRISPR系统CRISPR-FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中标记单拷贝基因位点SOX1和多拷贝位点Chr13Rep呈现共定位的示意图。
(B)显示使用CRISPR FISHer(绿色)配合含有2×PP7和8×PP7的sgRNA标记单拷贝基因位点SOX1与CRISPR-Sirius(红色)标记重复序列位点Chr13Rep共定位的结果图。
(C)显示使用CRISPR-Sirius(PCP-GFP)系统配合8×PP7的sgRNA标记单拷贝基因位点SOX1的结果图。标尺为5μm。
(D和E)显示双色CRISPR系统CRISPR-FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中标记单拷贝基因位点(TOP3,TOP1)和多拷贝位点(Chr3Rep,Chr13Rep)的示意图和结果图。
(F和G)显示在HepG2、Huh7和Hep3B中PCR扩增并测序HBV基因片段的结果。
图17显示用CRISPR FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中研究DNA断裂后发生非同源末端连接的动态过程。
(A)用CRISPR FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中共标记PPP1R2和重复序列位点Chr3Rep的示意图。
(B和C)显示用CRISPR-FISHer(绿色)和CRISPR-Sirius(红色)在U2OS细胞中共标记PPP1R2和重复序列位点Chr3Rep后,DNA断裂后发生非同源末端连接随时间变化的动态过程。
图18显示鉴定染色体重组后基因组序列结果。
(A)染色体重组后基因组序列拼接示意图。
(B和C)染色体重组后基因组序列Sanger测序结果图。
图19显示在HepG2中鉴定eccDNA和实时追踪eccDNA运动的结果。
(A)显示HepG2中已鉴定的多个eccDNA片段位置信息和大小。
(B和C)显示通过三轮PCR鉴定HepG2中eccDNA序列策略和结果图。
(D)显示用CRISPR FISHer系统标记环状eccDNA和Chr13来研究其运动规律结果图。
具体实施方式
虽然本发明可以以许多不同的形式来实施,但在此公开的是验证本发明原理的其具体的举例说明性实施方案。应该强调的是,本发明不限于所举例说明的具体实施方案。此外,本文使用的任何章节标题仅用于组织目的,并不被解释为限制所描述的主题。
除非在此另外定义,否则与本发明结合使用的科学和技术术语将具有本领域普通技术人员通常理解的含义。此外,除非上下文另有要求,单数形式的术语应包括复数形式,复数形式的术语应包括单数形式。更具体地,如在本说明书和所附权利要求中所使用的,除非上下文另外明确指出,否则单数形式“一种”,“一个”和“该”包括复数指示物。在本申请中,除非另有说明,否则使用“或”意指“和/或”。此外,术语“包含”以及其他形式(诸如“包括”和“含有”)的使用不是限制性的。此外,说明书和所附权利要求中提供的范围包括端点和断点之间的所有值。
定义
为了更好地理解本发明,相关术语的定义和解释提供如下。
术语CRISPR(Clustered regularly interspaced short palindromic repeats)是原核生物基因组内的一段重复序列,是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,简言之,感染病毒时,病毒能将其基因整合到细菌基因组上,并利用细菌的细胞工具为其基因复制服务,然而,细菌为了将病毒的外来入侵基因清除,进化出CRISPR-Cas9系统,利用这个系统,细菌可以不动声色地把整合的病毒基因从自己的染色体上切除,这是细菌特有的免疫系统。CRISPR技术是在20世纪90年代初发现的,之后随着研究的渗入,迅速成为人类生物学、农业和微生物学等领域最流行的基因编辑工具。
一般而言,“CRISPR系统”统称为转录物和涉及CRISPR相关(CRISPR associated,缩写为“Cas”)基因的表达或指导其活性的其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、向导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)、或来自CRISPR座位的其他序列和转录物。在一些实施例中,CRISPR系统的一个或多个元件来源于I型、II型或III型CRISPR系统。在一些实施方案中,CRISPR系统的一个或多个元件来源于包含内源CRISPR系统的特殊生物,如化脓链球菌。一般而言,CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为前间区)的形成的元件。在CRISPR复合物形成的背景下,“靶序列”是指向导序列被设计为对其具有互补性的序列,其中在靶序列与向导序列之间的杂交促进CRISPR复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进一种CRISPR复合物的形成。一个靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包括该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在本发明中,外源的模板多核苷酸可被称为编辑模板。在本发明的一个方面,该重组是同源重组。
Cas是指CRISPR相关(CRISPR associated,缩写为“Cas”)基因,也可以用来指该基因的表达产物(称为CRISPR酶或Cas9酶),目前发现的Cas包括Cas1~Cas10等多种类型。Cas基因与CRISPR共同进化,共同构成一个高度保守的系统。
dCas9是指“dead Cas9”,无DNA切割催化活性的Cas9(例如,通过突变D10A和H840A),通常是存在一个或多个NLS细胞核内定位信息的Cas蛋白或者含Cas蛋白的融合蛋白。
“sgRNA”:与Cas9(或dCas9)相结合的向导RNA。本系统所用的sgRNA同时携带与RNA结合基序相结合RNA适配体,例如PP7、MS2或BoxB等。
PP7:与向导RNA(sgRNA)融合的除了Cas9(或dCas9)之外的其他RNA结合基序的结合区域,一般与PCP相结合。
PCP:识别PP7的噬菌体外壳结合基序。
Foldon:一种来源于T4噬菌体纤维蛋白C末端的短肽,该结构域由三个相同的亚基构成,每个亚基包括一个β-发夹结构,将foldon与目标蛋白融合后,可以使目标蛋白自发形成三聚体[A.V.Letarov等人,Biochemistry(Moscow),Vol.64,No.7,1999,pp.817-823.Translated from Biokhimiya,Vol.64,No.7,1999,pp.974-981]。
“CRISPR-Sirius成像系统”是马涵慧等人[11]在2018年开发的一种基于CRISPR的成像系统。该系统由三部分组成:第一部分为dCas9的表达载体,第二部分为sgRNA-8×MS2/PP7表达载体,第三部分为MCP/PCP-荧光蛋白的表达载体。当上述三个质粒共转染细胞后,荧光蛋白就可以通过MCP或PCP与MS2或PP7结合,从而得到sgRNA-荧光蛋白复合物,该复合物又会识别基因组某一位点,引导dCas9结合至相应的位置,从而实现对该位点的成像标记。由于稳定8×MS2/PP7的存在,8个荧光蛋白也会稳定的聚集,通过这样的方式极大了提高了成像系统的分辨率。该系统的成像分辨率极限最高达到22个拷贝,低于22拷贝的基因位点是不可能通过该系统观察到。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短发夹RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、和引物。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。
“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。
如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。
通常,并且贯穿本说明书,术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括DNA、RNA、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达载体通常是质粒形式。
重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。
术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚U序列)。这样的调节序列例如描述于Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY,185,AcademicPress,San Diego,California,1990中。调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。
本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。
本发明的实施方案
本发明提供以下实施方案:
1.一种基于CRISPR的靶基因成像标记系统,其包含:
(1)dCas9表达载体;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;和
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接。
2.根据实施方案1所述的成像标记系统,其中所述改造的sgRNA表达载体由U6启动子驱动,优选地,所述U6启动子是鼠源U6启动子(mU6)或人源U6启动子(hU6)。
3.根据实施方案1所述的成像标记系统,其中所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
4.根据实施方案1所述的成像标记系统,其中n为2、3、4、5、6、7或8。
5.根据实施方案1所述的成像标记系统,其中n个RNA适配体串联连接,优选地通过接头串联连接。
6.根据实施方案1所述的成像标记系统,其中所述多聚化肽段为foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,并且其中所述多聚化肽段融合在荧光蛋白的N端或C端,或位于所述融合蛋白的N端或C端,优选地,所述多聚化肽段位于所述融合蛋白的N端。
7.根据实施方案1所述的成像标记系统,其中所述荧光蛋白为绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)。
8.根据实施方案1所述的成像标记系统,其中所述融合蛋白表达载体中还包含核定位序列(NLS)。
9.根据实施方案1所述的成像标记系统,其中所述dCas9表达载体被转染到细胞系中。
10.一种基于CRISPR的成像标记系统,其包含:
(1)dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接。
11.根据实施方案10所述的成像标记系统,其中所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
12.根据实施方案10所述的成像标记系统,其中n为2、3、4、5、6、7或8。
13.根据实施方案10所述的成像标记系统,其中n个RNA适配体串联连接,优选地通过接头串联连接。
14.根据实施方案10所述的成像标记系统,其中所述多聚化肽段为foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,并且其中所述多聚化肽段融合在荧光蛋白的N端或C端,或位于所述融合蛋白的N端或C端,优选地,所述多聚化肽段位于所述融合蛋白的N端。
15.根据实施方案10所述的成像标记系统,其中所述荧光蛋白为绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)。
16.根据实施方案10所述的成像标记系统,其中所述融合蛋白表达载体中还包含核定位序列(NLS)。
17.一种基于CRISPR的活细胞靶基因成像标记方法,所述方法包括:
(i)构建实施方案1-9中任一项所述的基于CRISPR的成像标记系统;
(ii)用所述成像标记系统中的各个表达载体转染待检测的细胞;和
(iii)使用共聚焦显微镜观察由所述成像标记系统形成的聚集点。
18.根据实施方案17所述的方法,其中所述方法用于活细胞中单拷贝基因或多拷贝基因的成像标记。
19.根据实施方案18所述的方法,其中所述基因位于染色体DNA之上或之外。
20.根据实施方案18所述的方法,其中所述基因是染色质外环状DNA元件(eccDNA)。
21.一种基于CRISPR的活细胞靶基因成像标记方法,所述方法包括:
(i)构建实施方案10-16中任一项所述的基于CRISPR的成像系统;
(ii)用所述成像标记系统中的dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体转染待检测的细胞;和
(iii)使用共聚焦显微镜观察由所述成像标记系统形成的聚集点。
22.根据实施方案21所述的方法,其中通过电转法用所述成像标记系统中的dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体转染待检测的细胞。
23.一种基于CRISPR的靶基因成像标记试剂盒,所述试剂盒包含实施方案1-9中任一项所述的基于CRISPR的成像标记系统的dCas9表达载体、改造的sgRNA表达载体和融合蛋白表达载体,其中所述dCas9表达载体、改造的sgRNA表达载体和融合蛋白表达载体各自存放在单独的容器中。
24.一种基于CRISPR的靶基因成像标记试剂盒,所述试剂盒包含实施方案10-16中任一项所述的基于CRISPR的成像标记系统的dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体,其中所述dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体各自存放在单独的容器中。
实施例
通过参考下面的实施例,本领域技术人员将更清楚本发明的技术方案及其技术效果。本领域技术人员应该理解,以下实施例仅用于举例说明的目的,并不以任何方式解释为限制本发明的保护范围。本发明的保护范围由权利要求书限定。在不背离本发明的精神和范围的前提下,本领域技术人员能够对本发明的实施方案进行相应的修改,这些修改也包括本发明的范围内。
下表1和表2列出了在以下实施例中使用的主要实验仪器和主要试剂与药品。除非另外指明,实施例中所用的试剂或药品均可商购获得。
表1.主要实验仪器
表2.试剂和药品
实施例1.构建CRISPR FISHer系统
构建的CRISPR FISHer系统包含:
(1)稳定表达dCas9的U2OS细胞系:首先将dCas9表达元件构建至慢病毒包装系统中,其次将该系统转染293T细胞系,获得病毒上清。最后利用病毒上清感染野生型U2OS细胞系,筛选获得稳定表达dCas9的U2OS细胞系;
(2)mU6-sgRNA-2×/8×PP7表达载体:该载体表达sgRNA,所述sgRNA识别待检测的基因组,引导dCas9与其结合,同时在sgRNA骨架中插入了稳定的2×PP7元件或8×PP7元件。其中mU6为sgRNA的启动子,核苷酸序列为SEQ ID No:8。
PP7存在于向导RNA(sgRNA)上除了Cas9之外的其他RNA结合基序的结合区域,一般与PCP相结合,PP7以茎环结构存在,本领域常用的几种PP7如下所示:
(3)Foldon-GFP-PCP表达载体
所构建的Foldon-GFP-PCP元件的氨基酸序列见SEQ ID No:22。
在应用时,首先表达的Foldon-GFP-PCP融合蛋白能够自发形成蛋白三聚体,其次PCP可以与PP7特异性结合,即Foldon-GFP-PCP表达蛋白会与sgRNA中PP7元件相结合。
具体的聚集过程如下:
sgRNA首先与dCas9蛋白结合形成复合物,然后dCas9/sgRNA结合到sgRNA靶标的DNA序列处,随后sgRNA上茎环处的PP7能够招募三聚体化的Foldon-GFP-PCP融合蛋白(如图5A所示)。
而三聚化的Foldon-GFP-PCP融合蛋白由于有三个PCP结构域,因此除了结合上dCas9蛋白与sgRNA形成复合物的茎环PP7外还能与其它sgRNA茎环处的PP7相结合。而其它的sgRNA也会招募更多的三聚化的Foldon-GFP-PCP融合蛋白。因此,本发明的系统会通过sgRNA与三聚化的PCP-Foldon-GFP融合蛋白反复招募结合最终会形成sgRNA-PP7-Foldon-GFP-PCP的聚集。此聚集体中会含有多个GFP荧光基团从而实现荧光信号的n倍数放大(n大于等于sgRNA的PCP茎环数目的3倍)(图8B)。
(3)多个sgRNA和绿色荧光蛋白GFP都会在目标序列周围聚集,从而极大的增加了该系统的分辨率和信号/背景比,最终达到只利用一个sgRNA即可成功地标记成像单拷贝基因位点的效果。
质粒的转化与提取:
参考马涵慧的方法[11],将构建的dCas9表达载体、mU6-sgRNA-8PP7表达载体和PCP-foldon-GFP表达载体分别转化到大肠杆菌DH5α细胞中,进行质粒扩增,然后分别用天根生化科技(北京)有限公司的高纯度质粒小提试剂盒(DP104)提取各种质粒。
细胞培养与传代:
参考马涵慧的方法[11],进行细胞培养和传代。
Lipofectamine 2000质粒瞬时转染:
(1)细胞铺板过夜培养,到转染时细胞密度应达到40~50%;
(2)质粒稀释于Opti-MEM中(根据表3选择用量),涡旋后静置5min;
(3)Lipofectamine 2000稀释于Opti-MEM(根据表3选择用量)中,涡旋后静置5min;
表3.质粒转染体系如下所示:
培养板规格 转染培养基 质粒 脂质体 DMEM
3.5cm培养皿 2×100μL 4.0μg 10μL 2mL
(4)将提前稀释好的脂质体(Lipofectamine 2000试剂盒(购自Invitrogen)自带)和质粒混合,涡旋后静置20min;
(5)将静置后的混合液缓慢滴加入培养皿中,缓缓晃动培养皿使之混匀;
(6)然后置于细胞培养箱中在37℃培养12h;
(7)12小时后观察细胞状态更换细胞培养基,荧光显微镜拍照。
蛋白样品制备:
按照本领域常规方法,制备蛋白样品。
BCA法测定蛋白浓度:
参考马涵慧的方法[11],利用BCA法测定蛋白浓度。
实施例2.验证foldon-GFP三聚化
依据标准分子克隆方法,将foldon元件与GFP融合(foldon融合在GFP的N端或C端),构建成融合蛋白表达载体,然后转染293T细胞,转染后12小时收集细胞,提取蛋白质,利用蛋白质印迹(western blot)非变性凝胶检测GFP三聚化情况,结果如图1和图2所示。
图1显示foldon元件和GFP融合构建体在293T细胞中表达12小时的荧光。可以看出,无论是对照组(左列,只有GFP)还是实验组(中列和右列,foldon分别融合在GFP的N端或C端),在转染后12小时时,荧光强度均已经达到近饱和状态。图2显示GFP蛋白质印迹非变性凝胶检测结果。其中GGS示意性表示接头序列。可以看到,相比于对照组的GFP(野生型,左侧泳道),无论在GFP的N端(中间泳道)还是C端(右侧泳道)融合foldon元件,均可以发生GFP的三聚化,但是在GFP N端融合foldon的三聚化效果相对C端融合更强。
图4显示纯化的foldon-GFP-PCP和PCP-GFP融合蛋白在变性(A,SDS-PAGE凝胶)和非变性(B,非变性凝胶)条件下的电泳分离的条带。可以看到,相比于对照组PCP-GFP,foldon-GFP-PCP可以发生三聚化(图4B)。
图2和图4的结果证明foldon元件同目标蛋白(例如荧光蛋白,例如,但不限于GFP)融合后会促进目标蛋白的三聚化。
实施例3.利用基于PCP-foldon-GFP的CRISPR FISHer系统成像标记端粒
为了成像标记活细胞中的端粒,使实施例1中制备的mU6-sgRNA-8×PP7表达载体的sgRNA部分为端粒特异性的(可以表示为mU6-sgTelomere-8×PP7表达载体,在表4中用“sgTel-8PP7”表示,其中“sgTelomere”或“sgTel”表示靶向端粒的sgRNA)。用dCas9表达载体(例如,CMV-dCas9)、mU6-sgTelomere-8×PP7表达载体和PCP-foldon-GFP表达载体共转染293T细胞,转染12小时后收取细胞,利用激光共聚焦显微镜检测荧光表达情况。
表4.共转染体系
荧光成像和荧光强度分析结果见图6(A和B)。该结果说明,相对于对照组CRISPR-Sirius成像结果(图6B,蓝色曲线,即,显示次高峰的曲线),本发明的CRISPR FISHer系统荧光点的强度更强,分辨率和信号/背景比都有非常明显的提升,并且几乎没有背景信号(图6B,红色曲线,即显示最高峰的曲线)。
图6C显示实验组细胞3D成像结果,同时利用imaris软件在0.2μm的阈值下对细胞内的荧光标记点做了统计,结果为94个绿色荧光点,这与293T细胞端粒个数(92个)是非常接近的。该结果说明本发明的CRISPR FISHer系统标记基因组位点的准确性也是非常高的。
实施例4.利用基于Foldon-GFP-PCP的CRISPR FISHer系统成像标记端粒
使实施例1中制备的mU6-sgRNA-2×PP7表达载体的sgRNA部分为端粒特异性的(可以表示为mU6-sgTelomere-2×PP7表达载体,在表5中用“sgTel-2PP7”表示)。用dCas9表达载体(例如,CMV-dCas9)、mU6-sgTelomere-2×PP7表达载体和Foldon-GFP-PCP表达载体共转染U2OS细胞,dCas9-EGFP和PCP-GFP作为对照。转染16小时后收取细胞,利用激光共聚焦显微镜检测荧光表达情况。
表5.共转染体系
第一组(对照组) 第二组(对照组) 第三组(实验组) 转染量
sgTel sgTel-2PP7 sgTel-2PP7 1000ng
dCas9-EGFP CMV-dCas9 CMV-dCas9 1000ng
EFS-PCP-GFPnls Foldon-GFP-PCP 2000ng
荧光成像和荧光强度分析结果见图5(D-F)。图5D显示实验组(有foldon)和对照组(无foldon)在相同的转染条件下标记端粒的GFP荧光成像结果,图5E和F显示这三组的信号/背景比对比。其中靶向端粒的sgRNA中插入2×PP7(sgTelomere-2×PP7),实验组表达dCas9、sgTelomere-2×PP7和foldon-PCP-GFP;对照组1表达dCas9-EGFP和sgTelomere-2×PP7;对照组2表达dCas9、sgTelomere-2×PP7和PCP-GFP(无foldon)。此版本的CRISPRFISHer系统中,实验组的信号/背景比最高可以达到对照组的10倍。
与此同时,为了探究foldon-GFP-PCP是否可以在靶位点聚集,我们首先利用Chr3q29一个重复基因组区域(~500个重复,命名为Chr3Rep)作为标记对象,使用dCas9-mCherry和sgRNA-2×PP7靶向Chr3Rep,随后在人骨肉瘤细胞U2OS中表达Foldon-GFP-PCP质粒(图5A)。根据荧光成像结果,foldon-GFP-PCP早在转染入核后4小时就出现,与Chr3Rep位点共定位,并逐渐变亮、清晰(图5B)。这些结果表明,靶DNA结合的dCas9/sgChr3Rep在增强靶位点的GFP信号、降低非特异性背景的同时,潜在地将foldon-GFP-PCP招募到靶位点。同时在HeLa和HepG2细胞,以进一步分析共定位。如预期的那样,转染24小时后,Foldon-GFP-PCP与dCas9-mCherry共定位良好(图5C)。为了进一步检测dCas9/sgRNA-2×PP7诱导的foldon-GFP-PCP定位在靶位点的特异性,我们利用另一种靶向Chr13q34重复元件的sgRNA(~350个重复,称为Chr13Rep),验证了该特异性信号(图11A)。
实施例5.利用基于PCP-Foldon-GFP的CRISPR FISHer系统成像标记单拷贝基因TOP3
TOP3基因是编码人类DNA拓扑异构酶III的单拷贝基因,位于人类17号染色体p11.2-12[23]。
为了成像标记单拷贝基因TOP3,按实施例1所述构建三个质粒:dCas9表达载体(例如,CMV-dCas9)、sgTOP3-8×PP7表达载体(即,使mU6-sgRNA-8×PP7表达载体中的sgRNA部分为TOP3特异性的)和PCP-foldon-GFP表达载体,用这三种表达载体共转染293T细胞,12小时后收取细胞,利用激光共聚焦显微镜检测荧光表达情况。
表5.共转染体系
荧光检测结果如图7所示。图7显示实验组(左起前两列)和对照组在相同的转染条件下标记单拷贝TOP3基因GFP的荧光检测结果:
(1)第一组和第二组(左数第1-2列)的结果均为TOP3基因的标记结果,其中两个荧光点和四个荧光点分别代表复制前后的基因位置;
(2)第五组(左数第5列)在第一组和第二组实验的基础上通过“T-vector TOP3”外源转染了TOP3基因上的一段序列,该序列为第一组和第二组sgRNA靶向序列,结果显示荧光点个数明显增多;
(3)第三组和第四组(左数第3-4列)在第一组和第二组实验的基础上外源转染了T载体的骨架(即,不含TOP3基因序列),结果同第一组和第二组类似,这说明第三组实验T载体骨架的引入对实验结果是没有影响的;
(4)第六组(左数第6列)实验为采用CRISPR Sirius系统的对照实验,融合蛋白为PCP-GFP(即,不含foldon),结果显示绿色荧光弥散分布,不能准确标记处对应的单拷贝位点。
实施例5的结果(图7所示)说明,本发明的CRISPR FISHer系统能够非常灵敏且准确的标记出单拷贝的基因,并且荧光强度和信号/背景比都有了明显的提升。由此,本发明的CRISPR FISHer系统能够很好地解决CRISPR成像领域目前“很难实现非重复基因标记”和“低信号/背景比”的问题。为后续基因转录、翻译等基因动态变化的更深入认识提供了很好的指示工具。
实施例6.基于Foldon-GFP-PCP的CRISPR FISHer实现在染色体DNA之上或之外的非重复区的活细胞成像
非重复基因组区域约占人类基因组的65%,包括几乎所有的蛋白质编码基因(图12)。因此,首先我们应用CRISPR FISHer系统来靶向活细胞中的非重复基因组区域。我们建立了稳定表达dCas9的U2OS细胞系。sgRNA(sgPPP1R2)靶向一个单拷贝基因PPP1R2,该基因位于Chr3q29,距离Chr3q29重复区约36kb。我们将表达PCP-GFP或foldon-GFP-PCP的质粒与sgPPP1R2-2×PP7共转染U2OS-dCas9细胞。与PCP-GFP和sgPPP1R2-2×PP7组弥散的绿色信号不同,我们在表达foldon-GFP-PCP和sgPPP1R2-2×PP7的细胞中观察到明亮的GFP标记荧光信号点,这表明通过CRISPR FISHer可以观察到在Chr3q29处的单拷贝基因PPP1R2(图8A-C)。此外,在没有dCas9或转染了野生型sgRNA或转染了非靶向人类基因组DNA的sgGal4的对照组细胞中,我们观察到绿色的信号会弥散在整个细胞核中或是在核仁中聚集(图13)
为了验证CRISPR FISHer标记的非重复DNA区域的特异性,我们使用CRISPRFISHer标记PPP1R2基因,并以2×MS2或8×MS2 CRISPR系统作为内参标记Chr3Rep(图8C和图14A)。正如预期的那样,CRISPR FISHer靶向sgRNA-2×PP7或sgRNA-8×PP7的两个位点在大多数U2OS细胞以及HeLa和HepG2细胞中高度共定位(图8D-E,图15)。与此同时,我们统计了不同U2OS细胞中CRISPR FISHer系统和CRISPR-Sirius标记PPP1R2基因的信号/背景比。我们发现,相比于绿色信号弥散的CRISPR-Sirius系统,CRISPR FISHer系统能够清晰的标记单拷贝基因,其信号/背景比最高可达到4(图8E)。
接下来,为了进一步测试CRISPR FISHer标记非重复区域的特异性,我们实施了另外三种不同的策略。首先,我们利用另一个单拷贝基因,SOX1(~250kb Chr13Rep Chr13)(图16A),并发现CRISPR FISHer标记的SOX1基因位点与Chr13Rep位点几乎重合(图16B-C)。其次,我们用不同的荧光蛋白标记Chr3Rep和Chr13Rep,发现sgPPP1R2-2×PP7与sgChr3Rep-tdTomato共定位,但不与sgChr13Rep-Halo共定位(图8F-G)。最后,我们针对U2OS细胞中Chr3Rep,Chr17上的TOP3和Chr20上的TOP1共同进行成像标记(图8G)。我们发现TOP3和TOP1的CRISPR FISHer信号没有与Chr3Rep的信号共定位(图8I),也没有与Chr13Rep共定位(图16D-E)
此外,我们将CRISPR FISHer的应用扩展到Hep3B细胞中,以检测乙肝病毒(HBV)。我们可以看到,相比于对照组sgGal4的弥散绿色荧光信号来说,靶向HBV的sgRNA可以呈现出明显的绿色点状信号(图8J-K,图16F-G)
实施例7.利用CRISPR FISHer系统追踪CRISPR诱导的双链断裂和非同源性末端接合修复
CRISPR诱导的双链断裂(DSB)大多通过非同源性末端接合(NHEJ)修复,NHEJ已被应用于基因治疗,以沉默单个或多个被靶向的基因。我们扩展了CRISPR FISHer用来追踪活细胞中CRISPR-Cas9诱导的DSB和随后的NHEJ修复过程的实时动态。为了在同一细胞中实现基因组DNA基因座成像和DSB诱导,除了基于SpCas9的基因组标记外,我们还引入了SaCas9/sgRNA来介导DNA切割。我们首先在U2OS细胞中递送基于SpCas9的成像系统,以便用CRISPRFISHer系统(sgPPP1R2-2×PP7-GFP)标记单拷贝基因PPP1R2和用CRISPR Sirus(sgChr3Rep-8×MS2-tdTomato)标记重复的Chr3q29区域;12小时后,我们将靶向PPP1R2基因(SaCas9/sgPPP1R2.2)的SaCas9/sgRNA系统电转移到Chr3上,以诱导在sgPPP1R2.2-2×PP7和sgChr3Rep标记的基因位点之间产生的DSB(图9A)。先后递送分别用于成像和编辑的两个正交CRISPR-Cas9系统,使我们能够追踪随着时间推移在单个基因位点上的DNA切割和修复过程(图9B-F,图17)。例如,我们捕获了PPP1R2基因座(绿色)与Chr3Rep基因座(红色)的分离和融合,这可能代表了SaCas9诱导的DSB和NHEJ介导的修复的整个过程(图9C,图17)。值得注意的是,NHEJ介导的成功的DNA修复过程在单个活细胞中仅持续一小时(图9B-C)。
CRISPR诱导的不同染色体上的多个基因编辑可以导致染色体易位[24]为了捕捉染色体间重排的动态,我们共同应用了依赖SpCas9的实时成像系统(该系统标记了在Chr13Rep、Chr3Rep和Chr3上的PPP1R2基因(sgPPP1R2.2-2×PP7)的基因座)和SaCas9系统(以介导在Chr3上的sgPPPP1R2.2与Chr3Rep基因座(SaCas9/sgPPP1R2)之间的基因组切割,以及与Chr13上的Chr13Rep相距82kb的SPACA7基因中的基因组切割)(图9G)。在连续递送CRISPR成像系统和CRISPR编辑系统后,我们能够观察到多对sgPPP1R2.2/Chr3和sgChr13Rep靶向的基因座,其距离显示几乎恒定(图9H),这表明Chr3上sgPPP1R2.2-2×PP7标记的PPP1R2基因已成功与接近Chr13Rep的SPACA7基因连锁。我们追踪了染色体易位的动态。最初,PPP1R2和Chr13Rep基因座分离,然后移近,并在一段时间内保持在一起,这可能表明NHEJ介导的染色体间的修复。最后,我们通过靶向测序验证了染色体易位事件(图18)。
实施例8.利用CRISPR FISHer系统标记染色质外环状DNA元件(eccDNA)
除了基因组DNA,染色质外环状DNA元件(eccDNA)被发现已经过了几十年。最近有报道称,它们具有强大的先天性免疫刺激剂的功能[25],而在活细胞中显现特异性和内源性eccDNA仍然具有挑战性。为了靶向特定的eccDNA,首先,我们从HepG2细胞中分离出eccDNA并进行了二代测序(图10A)。其中,eccBEND3、eccGABRR1和eccPRKCB的序列分别通过三轮PCR、TA克隆和Sanger测序进行独立验证(图19A-C)。之所以选择eccDNA连接序列作为CRISPR FISHer的靶点(图10B),是因为它们是唯一的,不存在于人类基因组中,这样就使得CRISPR FISHer能够进行特定的靶向(图10C)。我们观察了CRISPR FISHer靶向基因座在HepG2细胞中的三维分布(图10D),并计算了每个eccDNA的数量(图10E)。
接下来,我们跟踪了eccBEND3和Chr3靶向位点5min时空动态运动(图10F),我们发现eccBEND3的平均移动距离和空间超过了Chr3(图10G),这表明eccDNA是高度动态的,轨迹更长,运动更快。我们通过跟踪另外两个eccDNA和Chr13的实时运动进一步证实了这些动态差异(图19D)。此外,我们扩增了eccBEND3、eccGABRR1和eccPRKCB的线性eccDNA(图10H),并跟踪其动态(图10I)。我们发现,固有的环状eccDNA比线性eccDNA移动得更快,这表明,这种环装结构对eccDNA的快速移动至关重要(图10J)。
在这里,我们开发了一种方便、稳健、经济有效的CRISPR FISHer技术,能够实时成像活细胞基因组或染色体外DNA中的内源性非重复序列。据我们所知,CRISPR FISHer策略使用一种单一sgRNA以高灵敏度在活细胞中快速获得天然非重复DNA区域。带有适配体的sgRNA与RNA结合蛋白融合荧光蛋白、foldon肽组合,放大了局部荧光信号。结合正交dCas9成像系统,被靶向的DNA的成像范围将扩展到几乎所有感兴趣的CRISPR靶向的DNA区域。CRISPR FISHer能够动态显现活细胞中的染色体运动事件,如DNA损伤和染色体易位。染色质外DNA的显现将使我们能够从时空角度研究特殊eccDNA的功能。通过在CRISPR FISHer方法中应用多个正交RNA适配体,它具有追踪多个基因组的巨大潜力。CRISPR FISHer可以与诸如染色体构象捕获(3C)和Hi-C测序的其他技术相结合,加深我们对天然染色质空间和动力学组织的理解,并揭示活细胞中基因组高级结构动力学的机制。
实施例9.利用CRISPR FISHer系统标记染色质外腺相关病毒(AAV)
我们还利用CRISPR FISHer技术成功地以实时方式对外源入侵的DNA进行成像标记。腺相关病毒(Adeno-associated virus,AAV)是一种非致病性细小病毒,在人类基因治疗中具有广泛的应用前景[26]。双链AAV DNA由AAV单链DNA复制生成,因此我们可以利用CRISPR FISHer系统进行靶向成像标记(图10K)。
对于该实验,我们构建的CRISPR FISHer系统包含:dCas9表达载体,靶向AAV基因组中TBG基因的sgTBG-2×PP7表达载体,和foldon-GFP-PCP表达载体。
首先,通过4D-nucleofector我们将构建的CRISPR FISHer系统转染至U2OS细胞中,12小时后,CRISPR FISHer GFP信号表达并弥散在细胞核中,此时我们加入AAV颗粒对U2OS细胞进行感染。大约120min后,AAV和sgTBG质粒均能在细胞内观察到特异性的GFP荧光标记信号点,并且随着时间的推移,绿色荧光信号逐渐增强,但在无AAV感染和转染sgGal4质粒的对照组,我们只能观察到弥散的绿色荧光信号(图10L-M)。这表明本发明的CRISPRFISHer系统能够对活细胞中的ds AAV DNA进行成像标记。显著地,我们观察到在AAV感染后出现ds AAV DNA(图10M),这表明本发明的CRISPR FISHer系统能够用来评估活细胞中AAVDNA分子的数量。最后,我们追踪了5min的AAV DNA基因座的时空运动过程,发现相比于eccDNA来说,AAV单个基因座具有高运动性,但其运动被局限在一个特定的空间内,这可能有利于其自身的转录(图10N-O)。
本领域技术人员将进一步认识到,在不脱离其精神或中心特征的情况下,本发明可以以其他具体形式来实施。由于本发明的前述描述仅公开了其示例性实施方案,应该理解的是,其他变化被认为是在本发明的范围内。因此,本发明不限于在此详细描述的特定实施方案。相反,应当参考所附权利要求来指示本发明的范围和内容。
参考文献:
1.Sawada,H.and G.F.Saunders,Transcription of Nonrepetitive DNA inHuman Tissues.1974.34(3):p.516-520.
2.Langersafer,P.,M.Levine,and D.C.Ward,Immunological method formapping genes on Drosophila polytene.1982.
3.Schwarzacher,T.and J.S.J.M.i.M.B.Heslop-Harrison,Directfluorochrome-labeled DNA probes for direct fluorescent in situ hybridizationto chromosomes.1994.28:p.167.
4.Karen,D.,and T.J.C.i.L.Medicine,Fluorescence In SituHybridization.2011.
5.Qi,L.S.,et al.,Repurposing CRISPR as an RNA-guided platform forsequence-specific control of gene expression.2013.152(5):p.1173-1183.
6.Chen,B.,et al.,Dynamic Imaging of Genomic Loci in Living HumanCells by an Optimized CRISPR/Cas System.2013.155(7):p.1479-1491.
7.Duan,J.,et al.,Live imaging and tracking of genome regions inCRISPR/dCas9 knock-in mice.2018.19(1).
8.Tanenbaum,M.,et al.,A protein-tagging system for signalamplification in gene expression and fluorescence imaging.2014.159(3).
9.Shao,S.,et al.,Multiplexed sgRNA Expression Allows Versatile SingleNon-repetitive DNA Labeling and Endogenous Gene Regulation.2017.7(1).
10.Fu,Y.,et al.,CRISPR-dCas9 and sgRNA scaffolds enable dual-colourlive imaging of satellite sequences and repeat-enriched individualloci.2016.7:p.11707.
11.Ma,H.,et al.,Multiplexed labeling of genomic loci with dCas9 andengineered sgRNAs using CRISPRainbow.2016.
12.Ma,H.,et al.,CRISPR-Sirius:RNA scaffolds for signal amplificationin genome imaging.2018.15(11).
13.Larson,D.R.,et al.,Real-Time Observation of TranscriptionInitiation and Elongation on an Endogenous Yeast Gene.2011.332(6028):p.475.
14.Dynamics of CRISPR-Cas9 genome interrogation in living cells%JScience.2015.350(6262):p.823-826.
15.Ma,H.,et al.,CRISPR-Cas9 nuclear dynamics and target recognitionin living cells.2016:p.529.
16.Xiaotian,et al.,A CRISPR/molecular beacon hybrid system for live-cell genomic imaging.2018.46(13).
17.Delehanty,J.B.,et al.,Delivering quantum dot-peptide bioconjugatesto the cellular cytosol:escaping from the endolysosomal system.2010.2(5-6):p.265-277.
18.Santangelo,P.J.,et al.,Dual FRET molecular beacons for mRNAdetection in living cells.2004(6):p.e57.
19.Piston,D.W.and G.J.J.T.i.B.S.Kremers,Fluorescent protein FRET:thegood,the bad and the ugly.2007.32(9):p.407-414.
20.Muramoto,T.,et al.,Live imaging of nascent RNA dynamics revealsdistinct types of transcriptional pulse regulation.2012.109(19):p.7350-7355.
21.Chubb,J.R.,et al.,Transcriptional pulsing of a developmentalgene.2006.16(10):p.1018-1025.
22.Neguembor,M.V.,et al.,(Po)STAC(Polycistronic SunTAg modifiedCRISPR)enables live-cell and fixed-cell super-resolution imaging of multiplegenes.2017(5):p.5.
23.Hanai,R.,P.R.Caron,and J.C.Wang,Human TOP3:a single-copy geneencoding DNA topoisomerase III.Proc Natl Acad Sci U S A,1996.93(8):p.3653-7.
24.Ott,G.,et al.,The t(11;18)(q21;q21)Chromosome Translocation Is aFrequent and Specific Aberration in Low-Grade but not High-Grade MalignantNon-Hodgkin's Lymphomas of the Mucosa-associated Lymphoid Tissue(MALT-)Type.1997.57(18):p.3944-3948.
25.Wang,Y.,et al.,eccDNAs are apoptotic products with high innateimmunostimulatory activity.Nature,2021.599(7884):p.308-314.
26.Dhungel,B.P.,C.G.Bailey,and J.Rasko,Journey to the Center of theCell:Tracing the Path of AAV Transduction.2020.
序列表
<110> 西湖实验室(生命科学和生物医学浙江省实验室)
<120> 基于CRISPR的成像标记系统及其用途
<130> IDC216053
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> dCas9
<400> 1
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 442
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-8×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 2
nnnnnnnnnn nnnnnnnnnn gagagctact gccatgagga gcagacgata tggcgtcgct 60
ccgatccgac cagcagagca tatgggctcg ctggggctgc agcagcagag gatatggcct 120
cgctgcggag tgacgagcag accatatggg gtcgctcggc caccagaagc agaagatatg 180
gcttcgcttc cggacaacta gcagatcata tgggatcgct aggagtagag tagcagatga 240
tatggcatcg ctacgtgtga caagcagaac atatgggttc gcttgtcaca caaactactc 300
aaatgtccga aaggtggcaa acactccaaa gcagccaaac ggatcaaaca tggcagtagc 360
aagttcaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 420
tttatcgatg gcaagggaat tc 442
<210> 3
<211> 155
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-2×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 3
nnnnnnnnnn nnnnnnnnnn gtttgagagc taccggagca gacgatatgg cgtcgctccg 60
gtagcaagtt caaataaggc tagtccgtta tcaacttgga gcagacgata tggcgtcgct 120
ccaagtggca ccgagtcggt gctttttttg aattc 155
<210> 4
<211> 399
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-8×MS2
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 4
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggaatgacc accaggcatt 60
ccgatccgac gatggaccat caggccatcg agctgcagaa gtgacgacca cgcacttcgg 120
agtgacagag gaggatcacc cctctggcca ccagagtaga gcatcagcct actccggaca 180
actacggagg accaccccgt aggagtagag cgaggagcac cagccctcgc gtgtgacgat 240
gacgatcacg catcgtcaca caaactactc aaatgtccga aaggtggcaa acactccaaa 300
gcagctaaac ggatcaaaca tggcagtagc aagttcaaat aaggctagtc cgttatcaac 360
ttgaaaaagt ggcaccgagt cggtgctttt tttgaattc 399
<210> 5
<211> 169
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-2×MS2
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 5
nnnnnnnnnn nnnnnnnnnn gtttgagagc taggccaaca tgaggatcac ccatgtctgc 60
agggcctagc aagttcaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 120
ccatgtctgc agggccaagt ggcaccgagt cggtgctttt tttgaattc 169
<210> 6
<211> 360
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-8×BoxB
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 6
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg agggccctga aaaagggccc 60
gatccgaggg ccctgaagaa gggcccagct gcagggccct gaaaaagggc ccggagtgag 120
ggccctgaag aagggcccgc caccagggcc ctgaaaaagg gccccggaca agggccctga 180
agaagggccc gagtaggggc cctgaaaaag ggcccgtgtg agggccctga agaagggccc 240
acacaaacta ctcaaatgtc cgaaaggtgg caaacactcc aaagcagcta aacggatcaa 300
acatggcagt agcaagttca aataaggcta gtccgttatc aacttgaaaa agtggcaccg 360
<210> 7
<211> 139
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-2×BoxB
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 7
nnnnnnnnnn nnnnnnnnnn gtttgagagc tagggccctg aagaagggcc ctagcaagtt 60
caaataaggc tagtccgtta tcaacttggg ccctgaagaa gggcccaagt ggcaccgagt 120
cggtgctttt tttgaattc 139
<210> 8
<211> 314
<212> DNA
<213> 人工序列
<220>
<223> mU6启动子
<400> 8
gatccgacgc cgccatctct aggcccgcgc cggccccctc gcacagactt gtgggagaag 60
ctcggctact cccctgcccc ggttaatttg catataatat ttcctagtaa ctatagaggc 120
ttaatgtgcg ataaaagaca gataatctgt tctttttaat actagctaca ttttacatga 180
taggcttgga tttctataag agatacaaat actaaattat tattttaaaa aacagcacaa 240
aaggaaactc accctaactg taaagtaatt gtgtgttttg agactataaa tatcccttgg 300
agaaaagcct tgtt 314
<210> 9
<211> 241
<212> DNA
<213> 人工序列
<220>
<223> hU6启动子
<400> 9
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
c 241
<210> 10
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> Foldon
<400> 10
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1 5 10 15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Ser
20 25
<210> 11
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> GCN4
<400> 11
Met Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Ile Tyr
1 5 10 15
His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu Val
20 25 30
<210> 12
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> 3HB
<400> 12
Gly Glu Ile Ala Ala Ile Lys Gln Glu Ile Ala Ala Ile Lys Lys Glu
1 5 10 15
Ile Ala Ala Ile Lys Trp Glu Ile Ala Ala Ile Lys Gln Gly Tyr Gly
20 25 30
<210> 13
<211> 33
<212> PRT
<213> 人工序列
<220>
<223> 6G6H
<400> 13
Thr Gln Glu Tyr Leu Leu Lys Glu Leu Met Lys Leu Leu Lys Glu Gln
1 5 10 15
Ile Lys Leu Leu Lys Glu Gln Ile Lys Met Leu Lys Glu Leu Glu Lys
20 25 30
Gln
<210> 14
<211> 135
<212> PRT
<213> 人工序列
<220>
<223> PCP
<400> 14
Met Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr
1 5 10 15
Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys
20 25 30
Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln
35 40 45
Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala
50 55 60
Asp Val Val Asp Ser Gly Leu Pro Lys Val Arg Tyr Thr Gln Val Trp
65 70 75 80
Ser His Asp Val Thr Ile Val Ala Asn Ser Thr Glu Ala Ser Arg Lys
85 90 95
Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala Thr Ser Gln Val Glu
100 105 110
Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg Gly Gly Gly Gly Thr
115 120 125
Ser Gly Gly Gly Ser Gly Ser
130 135
<210> 15
<211> 126
<212> PRT
<213> 人工序列
<220>
<223> MCP
<400> 15
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile
65 70 75 80
Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met
85 90 95
Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala
100 105 110
Asn Ser Gly Ile Tyr Gly Gly Ser Gly Ser Gly Ala Gly Ser
115 120 125
<210> 16
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> N22
<400> 16
Met Gly Asn Ala Arg Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys Gln
1 5 10 15
Ala Gln Trp Lys Ala Ala Asn Gly Gly Gly Gly Thr Ser Gly Ser
20 25 30
<210> 17
<211> 241
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-3×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 17
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggagcagac gatatggcgt 60
cgctccgatc cgaccagcag agcatatggg ctcgctgggt gtgacaagca gaacatatgg 120
gttcgcttgt cacacaaacg gatcaaacat ggcagtagca agttcaaata aggctagtcc 180
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt ttatcgatgg caagggaatt 240
c 241
<210> 18
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-4×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 18
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggagcagac gatatggcgt 60
cgctccgatc cgaccagcag agcatatggg ctcgctgggg ctgcagcagc agaggatatg 120
gcctcgctgc gtgtgacaag cagaacatat gggttcgctt gtcacacaaa gcagccaaac 180
ggatcaaaca tggcagtagc aagttcaaat aaggctagtc cgttatcaac ttgaaaaagt 240
ggcaccgagt cggtgctttt tttatcgatg gcaagggaat tc 282
<210> 19
<211> 323
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-5×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 19
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggagcagac gatatggcgt 60
cgctccgatc cgaccagcag agcatatggg ctcgctgggg ctgcagcagc agaggatatg 120
gcctcgctgc ggagtgacga gcagaccata tggggtcgct cggtgtgaca agcagaacat 180
atgggttcgc ttgtcacaca aacactccaa agcagccaaa cggatcaaac atggcagtag 240
caagttcaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 300
ttttatcgat ggcaagggaa ttc 323
<210> 20
<211> 364
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-6×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 20
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggagcagac gatatggcgt 60
cgctccgatc cgaccagcag agcatatggg ctcgctgggg ctgcagcagc agaggatatg 120
gcctcgctgc ggagtgacga gcagaccata tggggtcgct cggccaccag aagcagaaga 180
tatggcttcg cttcgtgtga caagcagaac atatgggttc gcttgtcaca caaaggtggc 240
aaacactcca aagcagccaa acggatcaaa catggcagta gcaagttcaa ataaggctag 300
tccgttatca acttgaaaaa gtggcaccga gtcggtgctt tttttatcga tggcaaggga 360
attc 364
<210> 21
<211> 405
<212> DNA
<213> 人工序列
<220>
<223> sgRNA-7×PP7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n是a, c, g,或t
<400> 21
nnnnnnnnnn nnnnnnnnnn gtttgagagc tactgccatg aggagcagac gatatggcgt 60
cgctccgatc cgaccagcag agcatatggg ctcgctgggg ctgcagcagc agaggatatg 120
gcctcgctgc ggagtgacga gcagaccata tggggtcgct cggccaccag aagcagaaga 180
tatggcttcg cttccggaca actagcagat catatgggat cgctaggtgt gacaagcaga 240
acatatgggt tcgcttgtca cacaaatgtc cgaaaggtgg caaacactcc aaagcagcca 300
aacggatcaa acatggcagt agcaagttca aataaggcta gtccgttatc aacttgaaaa 360
agtggcaccg agtcggtgct ttttttatcg atggcaaggg aattc 405
<210> 22
<211> 416
<212> PRT
<213> 人工序列
<220>
<223> Foldon-GFP-PCP
<400> 22
Met Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg
1 5 10 15
Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Ser Gly Gly Gly
20 25 30
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg Lys Gly Glu
35 40 45
Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp
50 55 60
Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala
65 70 75 80
Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly Lys Leu
85 90 95
Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln
100 105 110
Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp Phe Phe Lys
115 120 125
Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys
130 135 140
Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp
145 150 155 160
Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp
165 170 175
Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser His Asn
180 185 190
Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe
195 200 205
Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala Asp His
210 215 220
Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp
225 230 235 240
Asn His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp Pro Asn Glu
245 250 255
Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile
260 265 270
Thr His Gly Met Asp Glu Leu Tyr Lys Met Gly Ser Lys Thr Ile Val
275 280 285
Leu Ser Val Gly Glu Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr
290 295 300
Ala Asp Arg Gln Ile Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg
305 310 315 320
Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr
325 330 335
Arg Val Asn Leu Lys Leu Asp Gln Ala Asp Val Val Asp Ser Gly Leu
340 345 350
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
355 360 365
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
370 375 380
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val
385 390 395 400
Pro Leu Gly Arg Gly Gly Gly Gly Thr Ser Gly Gly Gly Ser Gly Ser
405 410 415
<210> 23
<211> 448
<212> PRT
<213> 人工序列
<220>
<223> PCP-foldon-GFP
<400> 23
Met Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr
1 5 10 15
Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys
20 25 30
Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln
35 40 45
Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala
50 55 60
Asp Val Val Asp Ser Gly Leu Pro Lys Val Arg Tyr Thr Gln Val Trp
65 70 75 80
Ser His Asp Val Thr Ile Val Ala Asn Ser Thr Glu Ala Ser Arg Lys
85 90 95
Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala Thr Ser Gln Val Glu
100 105 110
Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg Gly Gly Gly Gly Thr
115 120 125
Ser Gly Gly Gly Ser Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser
130 135 140
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
145 150 155 160
Gly Gly Ser Ser Gly Gly Ser Met Gly Tyr Ile Pro Glu Ala Pro Arg
165 170 175
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
180 185 190
Thr Phe Leu Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
195 200 205
Gly Gly Ser Arg Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile
210 215 220
Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg
225 230 235 240
Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe
245 250 255
Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr
260 265 270
Thr Leu Thr Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met
275 280 285
Lys Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln
290 295 300
Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala
305 310 315 320
Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys
325 330 335
Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu
340 345 350
Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys
355 360 365
Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly
370 375 380
Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp
385 390 395 400
Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val
405 410 415
Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu
420 425 430
Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
435 440 445

Claims (14)

1.一种基于CRISPR的靶基因成像标记系统,其包含:
(1)dCas9表达载体或dCas9蛋白;
(2)改造的sgRNA表达载体,所述改造的sgRNA包含:含有n个RNA适配体的sgRNA骨架,和特异性针对待检测的靶基因的sgRNA序列,其中n为大于或等于2的整数;和
(3)融合蛋白表达载体,所述融合蛋白包含:特异性识别所述RNA适配体的RNA结合基序、多聚化肽段和荧光蛋白,它们之间以可操作的方式连接。
2.根据权利要求1所述的成像标记系统,其中所述改造的sgRNA表达载体由U6启动子驱动,优选地,所述U6启动子是鼠源U6启动子(mU6)或人源U6启动子(hU6)。
3.根据权利要求1所述的成像标记系统,其中所述RNA适配体和所述RNA结合基序以配对的组合形式存在,所述组合选自:PP7和PCP、MS2和MCP或BoxB和N22。
4.根据权利要求1所述的成像标记系统,其中n为2、3、4、5、6、7或8。
5.根据权利要求1所述的成像标记系统,其中n个RNA适配体串联连接,优选地通过接头串联连接。
6.根据权利要求1所述的成像标记系统,其中所述多聚化肽段为foldon三聚化小肽、GCN4三聚化小肽、3HB三聚化小肽或6G6H六聚化小肽,并且其中所述多聚化肽段融合在荧光蛋白的N端或C端,或位于所述融合蛋白的N端或C端,优选地,所述多聚化肽段位于所述融合蛋白的N端。
7.根据权利要求1所述的成像标记系统,其中所述荧光蛋白为绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、红色荧光蛋白(RFP)或蓝色荧光蛋白(BFP)。
8.根据权利要求1所述的成像标记系统,其中所述融合蛋白表达载体中还包含核定位序列(NLS)。
9.根据权利要求1所述的成像标记系统,其中所述dCas9表达载体被转染到细胞系中。
10.一种基于CRISPR的活细胞靶基因成像标记方法,所述方法包括:
(i)构建权利要求1-9中任一项所述的基于CRISPR的成像标记系统;
(ii)用所述成像标记系统中的各组分转染待检测的细胞;和
(iii)使用共聚焦显微镜观察由所述成像标记系统形成的聚集点。
11.根据权利要求10所述的方法,其中所述方法用于活细胞中单拷贝基因或多拷贝基因的成像标记。
12.根据权利要求11所述的方法,其中所述基因位于染色体DNA之上或之外。
13.根据权利要求11所述的方法,其中所述基因是染色质外环状DNA元件(eccDNA)。
14.一种基于CRISPR的靶基因成像标记试剂盒,所述试剂盒包含权利要求1-9中任一项所述的基于CRISPR的成像标记系统的dCas9表达载体或dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体,其中所述dCas9表达载体或dCas9蛋白、改造的sgRNA表达载体和融合蛋白表达载体各自存放在单独的容器中。
CN202210413917.9A 2022-04-15 2022-04-15 基于crispr的成像标记系统及其用途 Pending CN116949039A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210413917.9A CN116949039A (zh) 2022-04-15 2022-04-15 基于crispr的成像标记系统及其用途
PCT/CN2023/088712 WO2023198216A1 (en) 2022-04-15 2023-04-17 Crispr-based imaging system and use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210413917.9A CN116949039A (zh) 2022-04-15 2022-04-15 基于crispr的成像标记系统及其用途

Publications (1)

Publication Number Publication Date
CN116949039A true CN116949039A (zh) 2023-10-27

Family

ID=88329087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210413917.9A Pending CN116949039A (zh) 2022-04-15 2022-04-15 基于crispr的成像标记系统及其用途

Country Status (2)

Country Link
CN (1) CN116949039A (zh)
WO (1) WO2023198216A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117925787A (zh) * 2024-01-17 2024-04-26 北京医院 基于“内-外”双重信号放大的DCasFISH染色体多色原位成像系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018226575A1 (en) * 2017-06-05 2018-12-13 The Board Of Trustees Of The Leland Stanford Junior University Ribonucleoprotein-based imaging and detection
KR102117016B1 (ko) * 2017-12-14 2020-05-29 단국대학교 산학협력단 Crispr 시스템 기능 향상 방법 및 그의 이용
CN111718931B (zh) * 2020-06-17 2021-12-07 浙江大学 活细胞内同时可视化基因的DNA、mRNA和蛋白的标签及方法
CN112111490B (zh) * 2020-08-18 2024-01-12 南京医科大学 一种可视化活细胞中内源性低丰度单分子rna的方法及应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117925787A (zh) * 2024-01-17 2024-04-26 北京医院 基于“内-外”双重信号放大的DCasFISH染色体多色原位成像系统

Also Published As

Publication number Publication date
WO2023198216A1 (en) 2023-10-19

Similar Documents

Publication Publication Date Title
US20210403899A1 (en) Methods for the selection of binding proteins
CN113881652B (zh) 新型Cas酶和系统以及应用
WO2017215619A1 (zh) 在细胞内产生点突变的融合蛋白、其制备及用途
CA3012607A1 (en) Crispr enzymes and systems
CN113373130A (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
CN113015798B (zh) CRISPR-Cas12a酶和系统
CN114672473B (zh) 一种优化的Cas蛋白及其应用
CN112105728A (zh) CRISPR/Cas效应蛋白及系统
WO2022166895A1 (zh) Crispr酶和系统以及应用
CN114438055B (zh) 新型的crispr酶和系统以及应用
CN114507654B (zh) Cas酶和系统以及应用
WO2023198216A1 (en) Crispr-based imaging system and use thereof
US20200308239A1 (en) Genetically encoded fluorescent-iron ferritin nanoparticle probes for detecting an intracellular target by fluorescent and electron microscopy
CN112020560A (zh) 一种RNA编辑的CRISPR/Cas效应蛋白及系统
CA2658491A1 (en) Membrane-translocating peptides
JPWO2021202800A5 (zh)
WO2018164457A1 (ko) C2cL 엔도뉴클레아제를 포함하는 유전체 교정용 조성물 및 이를 이용한 유전체 교정 방법
EP1098987A1 (en) Method for transformation of animal cells
CN116162609A (zh) Cas13蛋白、CRISPR-Cas系统及其应用
WO2015163744A1 (ko) 다수의 단백질-단백질 상호작용 동시 분석을 위한 백터
CN114277015B (zh) Crispr酶以及应用
US20210180045A1 (en) Scalable tagging of endogenous genes by homology-independent intron targeting
WO2021042045A1 (en) Methods for scalable gene insertions
JP2022551931A (ja) 改変エンドヌクレアーゼおよび関連方法
JP4709971B2 (ja) 細胞内へ核酸を導入する為の新規な分子並びに細胞内へ導入する核酸および細胞内へ核酸を導入する為の新規な方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 3104 West Lake Street, Hangzhou, Zhejiang

Applicant after: West Lake Laboratory (Zhejiang Provincial Laboratory of life sciences and biomedicine)

Address before: Room 510, Building 1, Zhejiang Xihu Higher Research Institute, No. 18 Shilongshang Street, Xihu District, Hangzhou City, Zhejiang Province, 310024

Applicant before: West Lake Laboratory (Zhejiang Provincial Laboratory of life sciences and biomedicine)

Country or region before: China

CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: No.18 Shilongshan street, Yunqi Town, Xihu District, Hangzhou City, Zhejiang Province, 310024

Applicant after: West Lake Laboratory (Zhejiang Provincial Laboratory of life sciences and biomedicine)

Address before: 3104 West Lake Street, Hangzhou, Zhejiang

Applicant before: West Lake Laboratory (Zhejiang Provincial Laboratory of life sciences and biomedicine)

Country or region before: China

CB02 Change of applicant information
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40102405

Country of ref document: HK