CN115369115A - 降低环形rna水平的方法 - Google Patents

降低环形rna水平的方法 Download PDF

Info

Publication number
CN115369115A
CN115369115A CN202110532816.9A CN202110532816A CN115369115A CN 115369115 A CN115369115 A CN 115369115A CN 202110532816 A CN202110532816 A CN 202110532816A CN 115369115 A CN115369115 A CN 115369115A
Authority
CN
China
Prior art keywords
circular rna
rna
reverse
circular
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110532816.9A
Other languages
English (en)
Inventor
陈玲玲
李响
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Cell Science of CAS
Original Assignee
Center for Excellence in Molecular Cell Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Cell Science of CAS filed Critical Center for Excellence in Molecular Cell Science of CAS
Priority to CN202110532816.9A priority Critical patent/CN115369115A/zh
Publication of CN115369115A publication Critical patent/CN115369115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/532Closed or circular

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文涉及降低环形RNA水平的方法,包括突变5'和/或3'反向剪切位点,特别是突变5'和/或3'反向剪切位点的核酸保守元件。本发明还提供一种5'和/或3'反向剪接位点的核酸保守元件,包括位于所述反向剪切位点的外显子和内含子的交界处上下游各至少2个碱基。该方法和元件可用于环形RNA的敲除及其功能研究等。

Description

降低环形RNA水平的方法
技术领域
本发明涉及生物技术领域,具体涉及基因组编辑领域,具体涉及利用基因编辑技术降低环形RNA水平的方法。
背景技术
环形RNA(circRNA)是一类不具有5'末端帽子和3'末端poly(A)尾巴的非编码RNA分子,其以特殊的共价闭合环状结构存在。环形RNA主要通过由下游5'剪切位点连接至上游3'剪切位点的反向剪切(back-splicing)产生,并且受到顺式作用元件和反式作用因子的精密调控,目前已发现其在各种真核生物细胞中广泛表达。由于环形RNA在多种因素调控下,具有时空特异性的表达模式,近年来其生理功能受到广泛关注。例如,环形RNA在生理和病理条件下发挥作用,有些环形RNA通过不同的机制参与基因表达调控等。但是除个别环形RNA外,大部分环形RNA的功能尚不清楚,主要原因之一就是缺少研究环形RNA的方法。在环形RNA的敲除方法上,目前仅有极少的个例,如用CRISPR/Cas删除产生CDR1as的全部DNA序列,和删除circGCN1L1成环所需的侧翼反向互补序列。但对于大部分环形RNA而言,仍缺乏安全有效的敲除策略。
新型基因编辑技术,包括碱基编辑器(base editors,BE)和导向编辑器(primeeditors,PE)是近年来迅速发展的基因组操作工具。通过偶联不同种类的CRISPR/Cas(Clustered regularly interspaced short palindromic repeats/CRISPR-associatedprotein)蛋白和脱氨酶(nucleobase deaminase),碱基编辑器能够靶向基因组特定序列产生单碱基突变,实现单碱基精度胞嘧啶(cytosine,C)到胸腺嘧啶(thymine,T)(CBE)或腺嘌呤(adenosine,A)到鸟嘌呤(guanine,G)(ABE)的突变,同时不引入DNA双链断裂(DNAdouble-strand breaks,DSB)。此外,通过对CRISPR/Cas蛋白和脱氨酶改造,目前发展出了多种碱基编辑器,显著提高了编辑效率、特异性和安全性。由于碱基编辑技术的高效和安全的特点,其在基础研究和临床治疗都有广泛的应用价值,例如可以调控RNA可变剪切,引入终止密码子实现编码基因敲除等。而导向编辑器(prime editors,PE)通过融合CRISPR/Cas蛋白和反转录酶(reverse transcriptase),可以在prime editing guide RNA(pegRNA)的引导下,靶向特定位点以提供的模板进行基因编辑,从而实现任意一种碱基替换和小片段的插入缺失。
本领域尚无使用新型基因编辑技术修饰基因组DNA反向剪切位点以改变环形DNA水平的报道。
发明内容
本发明第一方面提供一种5'和/或3'反向剪接位点的核酸保守元件,所述核酸保守元件包括位于所述反向剪切位点的外显子和内含子的交界处上下游各至少2个碱基。
本发明第二方面提供一种降低环形RNA水平的方法,包括突变基因组中的5'和/或3'反向剪切位点,特别是突变5'和/或3'反向剪切位点的核酸保守元件。
在一个或多个实施方案中,所述环形RNA的基因组序列包含所述5'和/或3'反向剪切位点。
在一个或多个实施方案中,所述环形RNA的基因组序列在所述环形RNA的相应序列的5'和/或3'端包含5'和/或3'反向剪切位点。
在一个或多个实施方案中,所述核酸保守元件包括位于所述反向剪切位点的外显子和内含子的交界处上下游各至少2个碱基。
在一个或多个实施方案中,所述核酸保守元件中20-90%的碱基发生突变,优选30-85%的碱基发生突变,更优选40-85%的碱基发生突变。
在一个或多个实施方案中,发生突变的碱基可以是A、T、G和C中的任一个或多个。
在一个或多个实施方案中,所述突变选自以下的一种或多种:G突变为A、A突变为G、T突变为C、C突变为T。
在一个或多个实施方案中,所述突变通过ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)技术进行,优选使用本文任一实施方案所述的gRNA通过CRISPR、碱基编辑器(BE)或导向编辑器(PE)进行。
在一个或多个实施方案中,所述环形RNA通过如下方法筛选:
(1)利用环形RNA计算软件分析转录组测序数据,根据表达量筛选高置信度的环形RNA;
(2)获得3'和5'反向剪切位点位置附近(例如上下游各1-200bp之内,优选各10-100bp之内)的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA。
在一个或多个实施方案中,步骤(1)包括:利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA。
在一个或多个实施方案中,步骤(2)包括利用计算方法(例如BEable-GPS)获得所述序列。
在一个或多个实施方案中,所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)。优选地,所述突变工具是碱基编辑器ABE或CBE。
在一个或多个实施方案中,所述RNA测序数据是人源293FT RNA测序数据。
在一个或多个实施方案中,所述反向剪切位点(例如所述核酸保守元件)还参与正向剪切,并且所述突变还降低同源线性RNA的水平。
在一个或多个实施方案中,所述环形RNA包含SPECC1的第4个外显子、FOXP1第8-11个外显子。
在一个或多个实施方案中,所述环形RNA是circSPECC1、circFOXP1、或CDR1a。
在一个或多个实施方案中,所述环形RNA含有特异性表达外显子(predominantback-spliced exon),并且所述突变不降低同源线性RNA的水平。
在一个或多个实施方案中,所述含有特异性表达外显子的环形RNA通过如下方法筛选:
(1)利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;
(2)获取3'和5'反向剪切位点位置附近(例如上下游各1-200bp之内,优选各10-100bp之内)的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA,
其中,CIRCexplorer分析包含以下参数中的一个或多个或全部:mappedfragments≥3、GU/AG splice site motif with 3-nt offset、splice sites间距≤30,000nt、poly(A)+RNA-seq中HISAT2-mapped fragments≤3。
在一个或多个实施方案中,步骤(2)包括利用计算方法(例如BEable-GPS)获得所述序列。
在一个或多个实施方案中,所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)。优选地,所述突变工具是碱基编辑器ABE或CBE。
在一个或多个实施方案中,所述RNA测序数据选自人源293FT ribo–、poly(A)–、RNaseR RNA、293FT poly(A)+RNA测序数据。
在一个或多个实施方案中,所述环形RNA产生于RALY基因的第一个内含子和第二个外显子。
在一个或多个实施方案中,所述环形RNA是circRALY-nov。
本发明第三方面提供一种构建gRNA文库或gRNA引物文库的方法,包括:
(1)利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;
(2)获取3'和5'反向剪切位点位置附近(例如上下游各1-200bp之内,优选各10-100bp之内)的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA,
(4)根据步骤(3)获得的环形RNA设计用于突变其所含的5'和/或3'反向剪切位点的gRNA,对所述gRNA或其引物构建质粒形成文库,
在一个或多个实施方案中,所述环形RNA是含有特异性表达外显子的环形RNA,并且CIRCexplorer分析包含以下参数中的一个或多个或全部:mapped fragments≥3、GU/AGsplice site motif with 3-nt offset、splice sites间距≤30,000nt、poly(A)+RNA-seq中HISAT2-mapped fragments≤3。
在一个或多个实施方案中,所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)。优选地,所述突变工具是碱基编辑器ABE或CBE。
在一个或多个实施方案中,所述5'和/或3'反向剪切位点包含本文第一方面所述的核酸保守元件。
在一个或多个实施方案中,所述核酸保守元件中20-90%的碱基发生突变,优选30-85%的碱基发生突变,更优选40-85%的碱基发生突变。
在一个或多个实施方案中,发生突变的碱基可以是A、T、G和C中的任一个或多个。
在一个或多个实施方案中,所述突变选自以下的一种或多种:G突变为A、A突变为G、T突变为C、C突变为T。
在一个或多个实施方案中,所述突变通过ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)技术进行,优选使用本文任一实施方案所述的gRNA通过CRISPR、碱基编辑器(BE)或导向编辑器(PE)进行。
本文还提供本文第三方面中任一实施方案所述的方法构建的文库。
本文还提供本文第三方面中任一实施方案所述的方法所构建的gRNA文库在筛选环形RNA中的用途。
在一个或多个实施方案中,所述筛选包括:将gRNA文库导入宿主细胞,用感兴趣的物质处理细胞,对处理的细胞测序得到其gRNA数据,从而鉴定能响应所述处理发挥功能的环形RNA。
在一个或多个实施方案中,所述处理是病毒或致癌处理,经筛选的环形RNA具有抗病毒或抗癌功能。
在一个或多个实施方案中,所述宿主细胞中含有CRISPR、碱基编辑器(BE)或导向编辑器(PE)所需元件。
本发明还提供一种gRNA,所述gRNA具有SEQ ID NO:3-6中任一项所示序列。
附图说明
图1为本发明含有可编辑的特异性表达反向剪切外显子的环形RNA筛选流程图。
图2为本发明可编辑的环形RNA反向剪切位点的碱基编辑示意图。
图3为本发明sgRNA设计示意图。
图4为本发明用hA3A-eBE-Y130F编辑circSPECC1 5'反向剪切位点的效果。
A,基因组编辑效果;
B,环形和线性RNA表达水平。
图5为本发明用hA3A-eBE-Y130F编辑circFOXP1 3'反向剪切位点的效果。
A,基因组编辑效果;
B,环形和线性RNA表达水平。
图6为本发明用ABEmax编辑circSPECC1 5'反向剪切位点的效果。
A,基因组编辑效果;
B,环形和线性RNA表达水平。
图7为本发明用ABEmax编辑circFOXP1 3'反向剪切位点的效果。
A,基因组编辑效果;
B,环形和线性RNA表达水平。
图8为本发明用碱基编辑器敲除含有特异性表达外显子的环形RNA的示意图。
图9为本发明用hA3A-eBE-Y130F敲除circRALY-nov的效果。
A,基因组编辑效果;
B,环形和线性RNA表达水平。
图10为本发明用碱基编辑器敲除CDR1as结果。
A,基因组编辑效果;
B,环形RNA表达水平。
具体实施方式
本发明的目的在于提供一种利用新型基因编辑技术在各种物种和细胞系中高效敲除环形RNA的方法,以便进一步研究环形RNA在不同生理和病理条件下的生物学功能。
环形RNA(circRNA)是一类新近发现的非编码RNA分子。区别于传统线性RNA,环形RNA不具有5’末端帽子和3’末端poly(A)尾巴,并以共价键形成闭合环形结构。最新研究表明环形RNA主要是通过反向剪切(back-splicing)产生,广泛存在于各种生物细胞中,具有极高的结构稳定性,难以被外切核酸酶(exonuclease)降解,表达具有组织及时空特异性等特征。这些特征使得circRNA在疾病诊断与治疗方法的开发应用上具有广阔的前景。
发明人发现,很多环形RNA的基因组序列在5'和/或3'反向剪切位点(back splicesite,bss)存在核酸保守元件。本文中,反向剪切位点指基因序列中能发生反向剪切并且位于外显子和内含子的交界处的位置。反向剪切位点的核酸保守元件包括外显子和内含子的交界处上下游各至少2个碱基(总计至少4个碱基),例如AGGT、AGAG。在一些实施方案中,所述核酸保守元件如SEQ ID NO:1或2或其相应RNA序列或其互补序列所示。
对该保守元件进行突变可以抑制反向剪切,从而在基因组水平实现高效的环形RNA敲除。利用新型基因编辑技术突变剪切位点的经典碱基序列,有助于在各种细胞中更为广泛的基因组区域实现环形RNA的功能缺失型(loss-of-function)的研究,从而促进对环形RNA生成以及功能的探索。
本发明首先提供一种降低环形RNA水平的方法,包括突变基因组中的5'和/或3'反向剪切位点的核酸保守元件。所述环形RNA在其相应基因组序列中包含所述5'和/或3'反向剪切位点的核酸保守元件。如图4-6所示,所述核酸保守元件位于环形RNA在基因组中的相应序列的5'和/或3'端;例如SPECC1的第4个外显子的5'和/或3'端、FOXP1第8-11个外显子的5'和/或3'端、CDR1as(CDR1基因互补链反向转录(anti-sense)序列产生的环形RNA)的5'和/或3'端。
本文所述“突变”包括取代、缺失、插入突变或核酸碱基的丧失功能性修饰。发明人发现,核酸保守元件(例如AGGT、AGAG)中的任意碱基发生突变(例如G突变为A、A突变为G、T突变为C、或C突变为T)时可以显著降低5'和/或3'反向剪切位点的剪切效率,从而降低环形RNA水平。示例性地,核酸保守元件中20-90%的碱基发生所述突变,例如20-90%、30-80%或40-70%的碱基突变。所述比例的计算方式为CBE:Aheight/(Aheight+Gheight)或Theight/(Theight+Cheight),ABE:Cheight/(Cheight+Theight)或Gheight/(Gheight+Aheight)。该比例可通过Bioedit软件获取。
突变可以通过任何本领域已知的方法进行,例如ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE)等技术。
在使用CRISPR相关技术时需要用到gRNA。设计和制备gRNA的方法本领域周知,如图3所示。本文所使用的示例性gRNA如下所述:circSPECC1的gRNA序列为SEQ ID NO:3、circFOXP1的gRNA序列为SEQ ID NO:4、circRALY的gRNA序列为SEQ ID NO:5、CDR1as的gRNA序列为SEQ ID NO:6。
在一些实施方案中,所述反向剪切位点(例如所述核酸保守元件)还参与正向剪切(经典剪切),因此,突变这些反向剪切位点还可以降低环形RNA的同源线性RNA的水平。发明人通过如下方法筛选环形RNA:利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;利用计算方法(例如BEable-GPS)分析3'和5'反向剪切位点位置附近(例如上下游各1-200bp、优选10-100bp内)的序列;筛选可以被碱基编辑器靶向突变剪切位点的环形RNA。优选地,所述碱基编辑器是hA3A-eBE-Y130F或者ABEmax;所述RNA测序数据是人源293FT RNA测序数据。
具体地,本发明提供利用新型基因编辑技术突变环形RNA反向剪切位点信号从而敲除环形RNA的策略,包括使用靶向环形RNA反向剪切位点的gRNA(guide RNA,包括sgRNA和pegRNA)。在靶向环形RNA生成所需反向剪切位点的基因序列的gRNA引导下,使用CRISPR相关技术(例如碱基编辑器)破坏反向剪切位点信号,抑制反向剪切的发生。具体包括如下步骤:
(1)从UCSC数据库中下载基因组序列和基因注释文件。随后利用环形RNA计算分析流程CIRCexplorer系列对人源293FT RNA测序数据进行环形RNA预测和鉴定,共找到6,245个高置信度的环形RNA;
(2)利用BEDTools工具包提取环形RNA 3'和5'反向剪切位点位置上下游各30bp(即3'和5'反向剪切位点各61bp序列)和各50bp(即3'和5'反向剪切位点各101bp序列),保存为FASTA格式文件,作为设计sgRNA和pegRNA的输入序列;
(3)进一步使用计算方法(例如BEable-GPS)分析(2)中得到的输入序列,筛选可以被碱基编辑器hA3A-eBE-Y130F或者ABEmax靶向突变剪切位点的circRNA并寻找可用的PAM序列。其中可以被hA3A-eBE-Y130F靶向的环形RNA 2,719个,可以被ABEmax靶向的2,817个。同时设计靶向这些环形RNA的sgRNA和pegRNA;
(4)构建gRNA表达载体,与碱基编辑器共转到细胞中,对细胞基因组目标碱基进行编辑;
(5)提取细胞基因组DNA,将目标碱基所在区域基因组片段进行PCR扩增,通过测序检测编辑效率;
(6)提取细胞RNA,通过RT-qPCR检测环形和线性RNA表达水平。
在另一些实施方案中,在所述降低环形RNA水平的方法中,环形RNA含有特异性表达外显子,并且所述突变不降低同源线性RNA的水平。这样的环形RNA例如由RALY基因产生的环形RNA。发明人通过如下方法筛选含有特异性表达外显子的环形RNA:利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;利用BEable-GPS方法分析3'和5'反向剪切位点位置附近(例如上下游各1-200bp、优选10-100bp内)的序列,筛选可以被碱基编辑器靶向突变剪切位点的环形RNA。其中,CIRCexplore分析时添加以下参数:mapped fragments≥3,GU/AG splice site motif with 3-nt offset,splicesites间距≤30,000nt,并要求poly(A)+RNA-seq中HISAT2-mapped fragments≤3。从而得到所述含有特异性表达外显子的环形RNA。
具体地,本发明还提供靶向环形RNA中特异性表达外显子(predominant exon)序列,突变其反向剪切位点可以特异性敲除环形RNA,同时不降低同源线性RNA表达的策略。具体包括如下步骤:从UCSC数据库中下载基因组序列和基因注释文件;利用环形RNA计算分析流程CIRCexplorer系列对人源293FT ribo–,poly(A)–和RNaseR RNA测序数据进行环形RNA预测和鉴定,找到高置信度的环形RNA;添加以下参数使用CIRCexplorer分析:mappedfragments≥3、GU/AG splice site motif with 3-nt offset、splice sites间距≤30,000nt、poly(A)+RNA-seq中HISAT2-mapped fragments≤3,从而得到特异性参与反向剪切的外显子。其中包括:(1)已经在GRCh38/hg38人类基因组gencode.v31.annotation.gtf注释,在293FT细胞中特异性表达于circRNA的外显子;(2)未在GRCh38/hg38人类基因组gencode.v31.annotation.gtf注释,在293FT细胞中特异性表达于circRNA的外显子,这部分外显子称为未注释的外显子(circRNA predominant exon)。在一些实施方式中,所述方法可以突变特异性参与反向剪切的外显子的剪切位点,可以特异性敲除环形RNA,但不降低同源线性RNA表达。
本发明另一方面涉及构建gRNA文库的方法,包括(1)利用环形RNA计算软件分析转录组测序数据,根据表达量筛选高置信度的环形RNA,采用本文所述方法筛选具有特异性表达外显子的环形RNA;(2)根据步骤(1)获得的环形RNA设计用于突变其所含的5'和/或3'反向剪切位点的gRNA,对所述gRNA或其引物构建质粒形成文库。所述的5'和/或3'反向剪切位点包含本文所述的核酸保守元件。具体地,采用本文所述的设计方案构建高通量筛选功能性环形RNA的文库方法,可以用于环形RNA的高通量筛选。示例性步骤包括:
(1)从NCBI数据库中下载基因组序列和基因注释文件。下载已发表数据中多种组织和细胞系的高通量转录组测序数据,随后利用环形RNA计算分析流程CIRCexplorer系列进行环形RNA预测和鉴定;并根据表达量筛选高置信度的环形RNA;
(2)采用上述筛选特异性参与反向剪切的外显子的过程进一步筛选具有环形RNA特异性表达的外显子的环形RNA,并设计gRNA;
(3)文库构建:合成上述设计好的gRNA引物序列(寡核苷酸,Oligos),采用Gibson克隆方法进行组装,构建文库质粒,然后对构建后的gRNA文库进行高通量深度测序;
(4)文库质检:将gRNA引物序列作为参考序列进行比对,根据gRNA比对上的测序深度,对每条gRNA引物序列进行评级,综合评价文库的保真度。
本文包括上述构建的gRNA文库的应用。例如用于筛选环形RNA的用途包括:将gRNA文库导入宿主细胞,用感兴趣的物质或方法(例如病毒、癌细胞、致癌物质或致癌处理方法)处理细胞,对经处理的细胞测序得到其gRNA数据,从而鉴定响应所述处理(抗病毒或抗癌)的环形RNA。本文所述“响应”是指细胞针对感兴趣的物质做出正响应(例如增加、促进、激活、强化其数量或功能等)或负响应(例如减少、抑制、杀伤、弱化其数量或功能)。例如,若在特定gRNA存在下,某环形RNA被敲除,此时宿主细胞针对癌细胞处理合成更多的导致抗癌能力增强或减弱的物质,则表明该环形RNA具有抗癌或促癌作用。通常,所述宿主细胞中还含有CRISPR、碱基编辑器(BE)或导向编辑器(PE)所需元件。本领域知晓这些元件及其获取方法。例如Cas酶、脱氨酶、反转录酶或其融合蛋白、gRNA、pegRNA、hA3A-eBE-Y130F、ABEmax、PE3等。这些元件可以在将gRNA文库导入宿主细胞之前、期间或之后导入宿主细胞中。示例性的文库应用包括:在基因编辑器稳表细胞系中,感染上述gRNA文库制备的慢病毒液,浓度为MOI~0.2-0.5,以使平均每个细胞感染一条gRNA病毒。之后进行抗病毒、药物或抗癌症等筛选;对筛选后的细胞提取基因组进行高通量测序,分析得到的gRNA数据,以鉴定具有潜在功能性的环形RNA。
本发明还提供通过本文所述方法利用CRISPR、碱基编辑器(BE)或导向编辑器(PE)敲除环形RNA在环形RNA功能研究中的用途。例如,在使用碱基编辑器实现环形RNA的敲除后,研究环形RNA的缺失对细胞或个体的影响。
下文将以具体实施例的方式阐述本发明。应理解,这些实施例仅仅是阐述性的,并非意图限制本发明。实施例中所用到的材料和方法,除非另有说明,否则为本领域常规的材料和方法。
实施例
实施例1,鉴定可以被新型基因编辑技术靶向的环形RNA反向剪切位点及sgRNA设计
(1)环形RNA鉴定:从UCSC数据库中下载基因组序列和基因注释文件。如图1所示,利用环形RNA计算分析流程CIRCexplorer系列对人源293FT高通量测序数据进行环形RNA鉴定,找到高置信度的环形RNA;
(2)sgRNA设计模块:根据环形RNA注释反向剪切位点信息,分析反向剪切位点上下游各30bp的序列,发现反向剪切位点5'bss存在AG/gt的保守序列,在3'bss存在ag/GT的保守序列。进一步使用BEable-GPS提供的方法,在其反向剪切位点附近寻找可用的PAM(protospacer adjacent motif)序列设计gRNA,将反向剪切位点保守序列的正义链或负义链的一个或多个的碱基包含在基因编辑器的编辑窗口内,实现如图2和图3所示的剪切位点的突变。
实施例2,利用新型基因编辑技术突变反向剪切位点
选取circSPECC1和circFOXP1两个环形RNA,分别设计靶向circSPECC1的5'bss和circFOXP1的3'bss的sgRNA。将sgRNA寡合苷酸退火产物连接到BsaI线性化的pGL3-U6-sgRNA-PGK-puromycin载体中,寡合苷酸序列如下:
表1
Figure BDA0003068579020000131
使用Lipofectamine 3000Reagent(Invitrogen)将sgRNA载体和hA3A-eBE-Y130F载体共转到293FT细胞中,24h后加入终浓度为1μg/mL的puromycin进行筛选。48h后提取基因组DNA(TIANamp Genomic DNA Kit,TIANGEN)和RNA(Trizol,Life technologies)进行鉴定。
编辑效率鉴定:对靶点附近的基因组片段进行PCR扩增,回收目的条带进行sanger测序,所用引物如下:
表2
Figure BDA0003068579020000141
RNA表达水平检测:提取的RNA进行RT-qPCR检测环形和线性RNA的表达水平,qprimer序列如下:
表3
Figure BDA0003068579020000142
结果如图4和图5所示,hA3A-eBE-Y130F在circSPECC1的5'bss和circFOXP1的3'bss发生了40-70%的G到A,互补链为C到T的突变。如图6和图7所示,ABEmax在circSPECC1的5'bss和circFOXP1的3'bss发生了50-70%的A到G,互补链为T到C的突变。环形RNA和线性RNA的表达水平也产生了相应的降低,说明BE介导的同时参与反向剪切和经典剪切的位点的突变会引起环形和线性RNA的降低。
实施例3,利用新型基因编辑技术敲除含有环形RNA特异性表达外显子的环形RNA
如图1所示,我们分析了特异性表达于环形RNA的外显子,发现其中部分在参考注释(gencode.v31.annotation.gtf)中未被注释。如图6所示,我们设计了敲除含有特异性表达且未被注释的外显子的环形RNA的策略,使用新型基因编辑技术破坏这类环形RNA的特异性表达外显子反向剪接位点可以敲除环形RNA,且对线性RNA有较小的影响。我们选取了含有参与反向剪切的未被注释外显子的circRALY-nov,设计靶向这其3'剪接位点的sgRNA,对其基因组上的3'反向剪接位点处用BE进行了编辑。如图7所示,在293FT细胞中进行基因组编辑,hA3A-eBE-Y130F在RALY基因locus引入了85%G-to-A编辑效果,circRALY-nov也发生了相应水平的下降。同时,线性RNA没有受到明显影响。以上实验证明可以使用新型基因编辑技术对环形RNA特异性表达的外显子进行基因编辑,从而实现环形RNA的敲除,并对其同源线性RNA影响较小。所用引物序列如下:
表4
Figure BDA0003068579020000151
Figure BDA0003068579020000161
实施例4,利用新型基因编辑技术实现CDR1as敲除
CDR1as通过吸附miR-7影响其靶基因的表达,在神经分化过程中发挥重要作用。我们用设计靶向其基因组上的5'反向剪接位点的sgRNA,在293FT细胞中进行编辑。之后进一步挑选单克隆细胞,实现了CDR1as的敲除。所用引物序列如下:
表5
Figure BDA0003068579020000162
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均落在本发明的保护范围和公开范围之内。
序列表
<110> 中国科学院分子细胞科学卓越创新中心
<120> 降低环形RNA水平的方法
<130> 212369
<160> 36
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4
<212> DNA
<213> Artificial Sequence
<400> 1
aggt 4
<210> 2
<211> 4
<212> DNA
<213> Artificial Sequence
<400> 2
agag 4
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 3
tctcaccttg gccagcagac 20
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 4
ggaacctaga atgttaatga 20
<210> 5
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 5
agctctggat caaaagacaa 20
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 6
tacctggata ttgcagacac 20
<210> 7
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 7
accgtctcac cttggccagc agac 24
<210> 8
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 8
aaacgtctgc tggccaaggt gaga 24
<210> 9
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 9
accgggaacc tagaatgtta atga 24
<210> 10
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 10
aaactcatta acattctagg ttcc 24
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 11
gttgaaagta gcccgagcag 20
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 12
gaaccgccca taatcagaaa 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 13
tgcgtgcttc tgatttcctg 20
<210> 14
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 14
cccacgctgc tttactcttc 20
<210> 15
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 15
agaaatgttg aaagtagccc gag 23
<210> 16
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 16
gcctgtccgt ttagttgttg t 21
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 17
gtagcccgag cagagaaaga 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 18
gcagctttag gctggttctg 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 19
atgtgtctcc tcctctgcac 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 20
atcatagcca ctgacacggg 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 21
cggctacatg gagagtgtca 20
<210> 22
<211> 19
<212> DNA
<213> Artificial Sequence
<400> 22
agaacctgga gctgctgag 19
<210> 23
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 23
accgagctct ggatcaaaag acaa 24
<210> 24
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 24
aaacttgtct tttgatccag agct 24
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 25
cccggagaat ggttatgcca 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 26
ctgagtcctt cagccaggtg 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 27
tgctgaccct gtaacccaaa 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 28
tctggaacaa agcagcaagc 20
<210> 29
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 29
cttttcctcc ctcccttacg tc 22
<210> 30
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 30
agctgtttcc tcctttgggt t 21
<210> 31
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 31
accgtacctg gatattgcag acac 24
<210> 32
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 32
aaacgtgtct gcaatatcca ggta 24
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 33
ctcagacagg ggaagcctag 20
<210> 34
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 34
tgtcttccaa ctaagctacg tc 22
<210> 35
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 35
ggtcttccag tgtctgcaat 20
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 36
acccggagtt gttggaagac 20

Claims (10)

1.一种5'和/或3'反向剪接位点的核酸保守元件,包括位于所述反向剪切位点的外显子和内含子的交界处上下游各至少2个碱基。
2.一种降低环形RNA水平的方法,包括突变基因组中的5'和/或3'反向剪切位点,特别是突变5'和/或3'反向剪切位点的核酸保守元件。
3.如权利要求2所述的方法,其特征在于,
所述环形RNA的基因组序列包含所述5'和/或3'反向剪切位点,优选地,所述环形RNA的基因组序列在所述环形RNA的相应序列的5'和/或3'端包含所述5'和/或3'反向剪切位点,和/或
所述核酸保守元件包括位于所述反向剪切位点的外显子和内含子的交界处上下游各至少2个碱基,和/或
所述核酸保守元件中大于20%的碱基发生突变。
4.如权利要求2或3所述的方法,其特征在于,所述环形RNA是通过如下方法筛选得到的环形RNA:
(1)利用环形RNA计算软件分析转录组测序数据,根据表达量筛选高置信度的环形RNA;
(2)获得3'和5'反向剪切位点位置附近(例如上下游各1-200bp之内,优选各10-100bp之内)的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA,
优选地,所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE);更优选地,所述突变工具是碱基编辑器ABE或CBE。
5.如权利要求2-4中任一项所述的方法,其特征在于,所述反向剪切位点还参与经典剪切,并且所述突变还降低同源线性RNA的水平;优选地,所述环形RNA包含SPECC1的第4个外显子、FOXP1第8-11个外显子;更优选地,所述环形RNA是circSPECC1、circFOXP1、或CDR1as。
6.如权利要求2或3所述的方法,其特征在于,所述环形RNA含有特异性表达外显子,并且所述突变不降低同源线性RNA的水平,
优选地,所述含有特异性表达外显子的环形RNA通过如下方法筛选:
(1)利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;
(2)获取3'和5'反向剪切位点位置附近的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA,
其中,CIRCexplorer分析包含以下参数中的一个或多个或全部:mapped fragments≥3、GU/AG splice site motif with 3-nt offset、splice sites间距≤30,000nt、poly(A)+RNA-seq中HISAT2-mapped fragments≤3,
优选地,
所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE);更优选地,所述突变工具是碱基编辑器ABE或CBE,和/或
所述环形RNA产生于RALY基因;更优选地,所述环形RNA是circRALY-nov。
7.一种构建gRNA文库或gRNA引物文库的方法,包括:
(1)利用环形RNA计算分析流程CIRCexplorer系列分析RNA测序数据,得到高置信度的环形RNA;
(2)获取3'和5'反向剪切位点位置附近的序列;
(3)筛选能被突变工具靶向突变剪切位点的环形RNA,
(4)根据步骤(3)获得的环形RNA设计用于突变其所含的5'和/或3'反向剪切位点的gRNA,对所述gRNA或其引物构建质粒形成文库,
优选地,
所述突变工具选自ZFN、TELEN、CRISPR、碱基编辑器(BE)或导向编辑器(PE);更优选地,所述突变工具是碱基编辑器ABE或CBE,和/或
所述5'和/或3'反向剪切位点包含权利要求1所述的核酸保守元件。
8.由权利要求7所述的方法构建的文库。
9.由权利要求7所述的方法所构建的gRNA文库在筛选环形RNA中的用途,
优选地,
所述筛选包括:将gRNA文库导入宿主细胞,用感兴趣的物质处理细胞,对处理的细胞测序得到其gRNA数据,从而鉴定能响应所述处理发挥功能的环形RNA,
更优选地,
所述处理是病毒或致癌处理,经筛选的环形RNA具有抗病毒或抗癌功能,和/或
所述宿主细胞中含有CRISPR、碱基编辑器(BE)或导向编辑器(PE)所需元件。
10.一种gRNA,所述gRNA具有SEQ ID NO:3-6中任一项所示序列。
CN202110532816.9A 2021-05-17 2021-05-17 降低环形rna水平的方法 Pending CN115369115A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110532816.9A CN115369115A (zh) 2021-05-17 2021-05-17 降低环形rna水平的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110532816.9A CN115369115A (zh) 2021-05-17 2021-05-17 降低环形rna水平的方法

Publications (1)

Publication Number Publication Date
CN115369115A true CN115369115A (zh) 2022-11-22

Family

ID=84059392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110532816.9A Pending CN115369115A (zh) 2021-05-17 2021-05-17 降低环形rna水平的方法

Country Status (1)

Country Link
CN (1) CN115369115A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116376668A (zh) * 2023-03-24 2023-07-04 中国科学院空间应用工程与技术中心 一种全集成核酸检测芯片及其层叠结构和检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116376668A (zh) * 2023-03-24 2023-07-04 中国科学院空间应用工程与技术中心 一种全集成核酸检测芯片及其层叠结构和检测方法

Similar Documents

Publication Publication Date Title
US20220349004A1 (en) Compositions and methods for accurately identifying mutations
US20230091847A1 (en) Compositions and methods for improving homogeneity of dna generated using a crispr/cas9 cleavage system
Clausen et al. Tracking replication enzymology in vivo by genome-wide mapping of ribonucleotide incorporation
CN112752853B (zh) 测定核酸的碱基修饰
JP6017458B2 (ja) 大量並列連続性マッピング
Dabney et al. Length and GC-biases during sequencing library amplification: a comparison of various polymerase-buffer systems with ancient and modern DNA sequencing libraries
Dumbovic et al. Emerging roles of macrosatellite repeats in genome organization and disease development
CN110607356B (zh) 一种基因组编辑检测方法、试剂盒及应用
Lee et al. CRISPR diagnosis and therapeutics with single base pair precision
US20220136041A1 (en) Off-Target Single Nucleotide Variants Caused by Single-Base Editing and High-Specificity Off-Target-Free Single-Base Gene Editing Tool
US11834652B2 (en) Compositions and methods for scarless genome editing
JP2022031485A (ja) 細胞系譜の多重定量分析のための組成物及び方法
CN115369115A (zh) 降低环形rna水平的方法
EP3870718B1 (en) Methods and uses of introducing mutations into genetic material for genome assembly
Pulido-Quetglas et al. Designing libraries for pooled CRISPR functional screens of long noncoding RNAs
US20240011055A1 (en) Precise genome deletion and replacement method based on prime editing
CN116478961B (zh) CRISPR/SprCas9基因编辑系统的开发及应用
CN116286738B (zh) Dsb-pe基因编辑系统及其应用
Yao et al. Transcription-wide impact by RESCUE-induced off-target single nucleotide variants in mammalian cell
Li et al. Enrichment of prime-edited mammalian cells with surrogate PuroR reporters
GB2621392A (en) Methods and uses
CN115701838A (zh) 编码crebbp基因突变体的核酸及其应用
Wimberger Improving integration efficiency and precision of CRISPR/Cas9-mediated genome editing
Hebert et al. Efficient and multiplexed somatic genome editing with Cas12a mice
EP3283646B1 (en) Method for analysing nuclease hypersensitive sites.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination