CN107164375A - 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用 - Google Patents

一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用 Download PDF

Info

Publication number
CN107164375A
CN107164375A CN201710380366.XA CN201710380366A CN107164375A CN 107164375 A CN107164375 A CN 107164375A CN 201710380366 A CN201710380366 A CN 201710380366A CN 107164375 A CN107164375 A CN 107164375A
Authority
CN
China
Prior art keywords
crispr
guide rna
dna
systems
cas9
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710380366.XA
Other languages
English (en)
Other versions
CN107164375B (zh
Inventor
孙际宾
郑小梅
郑平
马延和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN201710380366.XA priority Critical patent/CN107164375B/zh
Publication of CN107164375A publication Critical patent/CN107164375A/zh
Application granted granted Critical
Publication of CN107164375B publication Critical patent/CN107164375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种应用于CRISPR/Cas系统的向导RNA表达盒,所述向导RNA表达盒以5S rRNA基因作为启动子来起始向导RNA的表达;本发明还提供包含所述向导RNA表达盒的CRISPR/Cas系统以及利用所述系统进行基因组编辑的方法。本发明的向导RNA表达盒、CRISPR/Cas系统以及基因组编辑的方法具有通用性、高效性、简便性以及准确性等优势。

Description

一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用
技术领域
本发明属于生物技术领域;具体地说,本发明涉及一种以5S rRNA基因为启动子的新型向导RNA表达盒及其在CRISPR/Cas系统中的应用。
背景技术
CRISPR/Cas(clustered regularly interspaced short palindromic repeats/CRISPR-associated proteins)系统为细菌与古生菌中抵御外源病毒或质粒DNA入侵的获得性免疫系统。该系统的核酸酶在crRNA的指导下识别并降解外源DNA。其中,II型CRISPR/Cas系统组成简单,仅包括一个核酸酶Cas9与tracrRNA:crRNA二聚体便可完成识别和切割功能。CRISPR/Cas9系统以其设计操纵简便、编辑高效与通用性广等优势迅速成为新一代的基因组编辑技术,已被广泛应用于人、小鼠、大鼠、斑马鱼、秀丽隐杆线虫、植物、真菌与细菌等不同物种(Hsu et al.2014)。
基于CRISPR/Cas9的基因组编辑技术中,Hsu等(Hsu et al.2013)将tracrRNA:crRNA二聚体被进一步设计为单一的嵌合向导RNA(single chimeric guide RNA,sgRNA),其包含位于5’-端的靶DNA的互补序列以及位于3’-端的tracrRNA:crRNA的类似序列,利用靶DNA的互补序列来定位需编辑的位点,利用tracrRNA:crRNA的骨架序列(Scaffoldsequence)与Cas9结合。该技术中仅只需改变向导RNA中的位于PAM(protospacer-adjacentmotif,5’-NGG DNA motif)上游17-20bp的原间隔序列(protospacer),即可使Cas9定位到不同的靶DNA序列,并引入DNA双链断裂。CRISPR/Cas9介导的基因组编辑技术依赖于细胞自身的DNA修复机制。在特定位点产生的双链DNA断裂可通过非同源末端连接(non-homologous end-joining,NHEJ)或同源重组(homology directed repair,HDR)得以修复。NHEJ是易错修复,会在双链DNA断裂处引入碱基的插入或缺失,从而造成特定基因的失活。若细胞中引入HDR所需要的带有同源臂的供体DNA(donor DNA,dDNA),则可实现定点突变或特定序列的插入与敲除。
在CRISPR/Cas9系统中,向导RNA的表达水平对Cas9的定位与切割效率都有显著的影响。向导RNA的表达是限制真核生物CRISPR技术开发应用的关键。虽然在哺乳动物中建立了以U6启动子启动向导RNA转录的CRISPR/Cas9技术,但由于真核生物的启动子序列物种间差别很大,在一些物种中U6等小RNA的启动子并不容易找到,且通常需要耗费时间优化其效率。比如,周志华等(Liu et al.2015)首次在丝状真菌里氏木霉中测试CRISPR/Cas9系统的可行性时,由于真菌小RNA转录机制认识的缺乏,不得不采用向导RNA体外转录然后再转化至细胞的方法。虽然向导RNA体外转录后以RNA的形式也可导入细胞中,引导Cas9蛋白的定位,但向导RNA的稳定性与转化效率会影响基因组编辑效率,且增加操作难度。
在真菌中,也有研究通过与人类U6snRNA的序列比对来寻找内源的U6snRNA,用来引导向导RNA的转录。但在研究案例(Zhang et al.2016)中初级转化平板上不容易获得直接编辑转化子或获得的转化子较少。再如烟曲霉(Fuller et al.2015)与粗糙脉孢霉(Matsu-ura et al.2015)中直接采用酵母SNR52的启动子,但效率较低。另外,在产黄青霉(Pohl et al.2016)中,测试了以tRNA为由RNA聚合酶III识别的启动子启动向导RNA的转录,在所检测的转化子中也可发生基因敲除。但在解脂酵母(Schwartz et al.2016)中,发现使用tRNAGly为启动子时,其基因失活效率仅为30%左右。
一些高强度的RNA聚合酶II所识别的启动子如PtrpC与PgpdA等也可起始向导RNA的转录,在稻瘟霉(Arazoe et al.2015)与曲霉(Nodvig et al.2015)中获得了应用,但与由RNA聚合酶III识别的启动子相比,其介导的基因失活效率较低。这可能由于II型启动子所引起向导RNA的转录通读或5’-加帽与3’-加尾等转录后修饰干扰了向导RNA与Cas9结合,也可能由于转录活性相对较低所致。曲霉中在使用PgpdA进行向导RNA转录时,研究者在向导RNA的5’-端与3’-端分别加入了锤头核酶HH(hammerhead,HH)与肝炎病毒核酶HDV(hepatitis delta virus,HDV)以减少干扰,但由于锤头核酶HH中有六个碱基需与向导RNA中的靶序列互补配对,导致向导RNA表达系统构建较为繁琐。
因此,本领域急需跨物种、通用性高的、能够有效提高向导RNA表达水平的技术手段。
发明内容
本发明的目的提供一种能够应用于CRISPR/Cas系统的向导RNA表达盒,该表达盒能够具备通用性和高效性;同时利用该新型CRISPR/Cas9系统进行基于同源重组的基因组精确编辑时,能够提高基因组编辑的简便性以及显著提高基因打靶的准确性。
在第一方面,本发明提供一种应用于CRISPR/Cas系统的向导RNA表达盒,所述向导RNA表达盒是由真核生物的RNA聚合酶III识别的type 1启动子来起始向导RNA的表达。
在具体的实施方式中,所述由真核生物的RNA聚合酶III识别的type 1启动子具有真核生物的5S rRNA基因的序列。
在优选的实施方式中,所述真核生物的5S rRNA基因的序列是黑曲霉的5S rRNA基因的序列。
在优选的实施方式中,所述真核生物的5S rRNA基因的序列如SEQ ID NO:6的1-118位所示。
在优选的实施方式中,所述由真核生物的RNA聚合酶III识别的type 1启动子是真核生物的5S rRNA的内部启动子。
在具体的实施方式中,所述向导RNA的表达盒从5’-3’具有以下结构:
A-B-C
其中,
A为真核生物的RNA聚合酶III识别的type 1启动子;
B为无或可自我切割的核酶;
C为向导RNA。
在具体的实施方式中,所述可自我切割的核酶选自HH核酶(hammerhead,HHribozyme)、HP核酶(hairpin HP ribozyme)、glmS核酶(Glucosamine 6-phosphatesynthase,glmS ribozyme)、VS核酶(Varkud satellite,VS ribozyme)、HDV核酶(hepatitis delta virus,HDV ribozyme)与类HDV核酶(Hepatitis delta virus-like,HDV-like ribozyme)等;更优选地,所述核酶是HDV核酶与HH核酶。
在第二方面,本发明提供一种载体,所述载体包含本发明第一方面所述的表达盒。
在第三方面,本发明提供一种CRISPR/Cas系统,所述CRISPR/Cas系统包含权利要求1-4中任一项所述的向导RNA表达盒。
在具体的实施方式中,所述的CRISPR/Cas系统是CRISPR/Cas9系统、CRISPR/nCas9系统或CRISPR/dCas9系统;优选地,所述CRISPR/Cas系统是CRISPR/Cas9系统。
在优选的实施方式中,所述CRISPR/Cas系统用于基因组编辑。
在优选的实施方式中,所述CRISPR/Cas系统用于基因表达调控。
在优选的实施方式中,利用所述CRISPR/Cas9系统进行基因失活编辑,获得的基因失活率高于95%,更优选达到100%。
在优选的实施方式中,所述的CRISPR/Cas系统,特别是CRISPR/Cas9系统可利用15-3000bp的同源臂的供体DNA进行基因精准编辑;在进一步的优选实施方式中,所述的CRISPR/Cas系统,特别是CRISPR/Cas9系统可利用20-200bp的同源臂的供体DNA进行基因精准编辑;例如,供体DNA的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述CRISPR/Cas9系统利用短同源臂的供体DNA进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。
在优选的实施方式中,所述CRISPR/Cas系统用于对黑曲霉进行基因组编辑。
在第四方面,本发明提供一种基因组编辑方法,所述方法利用本发明第三方面所述的CRISPR/Cas系统进行基因组编辑。
在优选的实施方式中,利用所述CRISPR/Cas9系统进行基因失活编辑,获得的基因失活率高于95%,更优选达到100%。
在优选的实施方式中,所述的CRISPR/Cas系统,特别是CRISPR/Cas9系统可利用15-3000bp的同源臂的供体DNA进行基因精准编辑;在进一步的优选例中,在进一步的优选实施方式中,所述的CRISPR/Cas系统,特别是CRISPR/Cas9系统可利用20-200bp的同源臂的供体DNA进行基因精准编辑;例如,供体DNA的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述CRISPR/Cas9系统利用短同源臂的供体DNA进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。
在优选的实施方式中,所述基因组编辑方法用于基因失活。
在优选的实施方式中,所述基因组编辑方法用于调控基因的转录表达强度。
在优选的实施方式中,所述基因组编辑方法用于基因的精确编辑,其中所述精确编辑包括但不限于点突变、序列敲除、序列插入等。
在具体的实施方式中,该方法用于真核生物的基因组编辑和转录调控。
在优选的实施方式中,所述真核生物包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、牛、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。
在优选的实施方式中,所述的酵母包括但不限于酿酒酵母、毕赤酵母与解脂耶氏酵母;所述的丝状真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉、嗜热毁丝霉、黑粉菌。
在优选的实施方式中,所述的丝状真菌为黑曲霉。
在具体的实施方式中,所述基因组编辑方法应用于NHEJ系统活性弱化的真核生物。
在具体的实施方式中,所述NHEJ系统活性弱化是通过kusA基因失活实现。
在优选的实施方式中,所述kusA基因失活的真核生物通过CRISPR/Cas系统对真核生物的编辑获得。
在优选的实施方式中,所述的基因组编辑方法利用含有不同长度同源臂的供体DNA对NHEJ系统活性弱化的真核生物进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。
在优选的实施方式中,所述的基因组编辑方法利用含有同源臂的供体DNA对kusA基因失活的黑曲霉进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。
在进一步的优选实施方式中,供体DNA的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp;而所述方法的基因组编辑的效率可以达到100%。
在第五方面,本发明提供真核生物的RNA聚合酶III识别的type 1启动子在向导RNA介导的CRISPR/Cas系统中作为启动子起始向导RNA转录的应用。
在优选的实施方式中,所述RNA聚合酶III识别的type 1启动子具有5S rRNA基因的序列。
在优选的实施方式中,所述5S rRNA是黑曲霉的5S rRNA。
在优选的实施方式中,所述5S rRNA基因的序列如SEQ ID NO:6的1-118位所示;
在优选的实施方式中,所述RNA聚合酶III识别的type 1启动子是5S rRNA基因的内部启动子。
在优选的实施方式中,所述向导RNA介导的基因组编辑系统是CRISPR/Cas系统;优选地所述CRISPR/Cas系统是CRISPR/Cas9系统、CRISPR/nCas9系统或CRISPR/dCas9系统;更优选地,所述CRISPR/Cas系统是CRISPR/Cas9系统。
在优选的实施方式中,所述向导RNA介导的基因组编辑系统所应用的物种包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。
在进一步的优选实施方式中,酵母包括但不限于酿酒酵母、毕赤酵母与解脂耶氏酵母;丝状真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉、嗜热毁丝霉、黑粉菌。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了Cas9的蛋白表达载体pCas9的质粒图谱;
图2显示了本发明中一系列向导RNA表达盒设计;
图3显示了以5S rRNA为启动子的向导RNA表达盒的克隆载体p5S-sgRNA(A)与p5S-HDV-sgRNA(B);
图4显示了不同启动子起始向导RNA转录的CRISPR/Cas9系统介导的albA基因失活转化子的检测结果;
图5显示了以5S rRNA为启动子起始向导RNA转录的CRISPR/Cas9系统介导的albA不同靶序列的基因失活转化子的检测结果;
图6显示了在黑曲霉中新型CRISPR/Cas9系统介导albA基因插入编辑;其中:A为albA基因插入编辑菌株的构建与重组的示意图;B为CRISPR/Cas9系统介导的albA基因插入编辑转化子的基因组PCR检测结果;
图7显示了新型CRISPR/Cas9系统中Cas9与sgRNA位于同一质粒的pCas9sgRNA的质粒图谱;
图8显示了新型CRISPR/Cas9系统中Cas9与sgRNA位于同一质粒的albA基因失活突变与定点插入效率检测结果;其中:A为albA基因失活转化子的初级转化平板;B为albA基因插入编辑转化子的初级转化平板;C为albA基因插入编辑转化子的基因组PCR检测结果;
图9显示了在黑曲霉中新型CRISPR/Cas9系统介导的kusA基因插入编辑菌株构建;其中:A为NHEJ系统关键基因kusA失活菌株的构建与重组的示意图;B为CRISPR/Cas9系统介导的kusA基因编辑转化子的基因组PCR检测结果;
图10显示了在黑曲霉kusA基因失活菌株中利用长同源臂黑曲霉新型CRISPR/Cas9系统介导albA基因敲除菌株构建;其中:A为albA基因长同源臂介导的基因敲除菌株构建与重组示意图;B为CRISPR/Cas9系统介导的albA基因长同源臂介导的基因敲除转化子的基因组PCR检测结果;
图11显示了在黑曲霉kusA基因失活菌株中利用短同源臂黑曲霉新型CRISPR/Cas9系统介导albA基因敲除菌株构建;其中:A为albA基因短同源臂介导的基因敲除菌株构建与重组示意图;B为CRISPR/Cas9系统介导的albA基因短同源臂介导的基因敲除转化子的基因组PCR检测结果;
图12显示了不同5S rRNA上游序列的向导RNA表达盒的CRISPR/Cas9系统介导albA基因突变,其中,A为黑曲霉5S rRNA启动子的核心元件与一系列含有不同长度的5S rRNA上游序列的向导RNA表达盒的设计;B为一系列含有不同长度的5S rRNA上游序列的向导RNA表达盒的构建结果(其中:1-6为分别为Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1的5S rRNA-HDV-sgRNA表达盒);C为利用这一系列向导RNA表达盒组成的CRISPR/Cas9系统介导albA基因失活效率的检测结果;
图13显示了来源于真菌、植物与动物的不同物种5S rRNA基因的生物信息学分析,其中,A为基于不同物种来源的5S rRNA基因序列的进化树分析;B为针对于来源于真菌、植物与动物的不同物种5S rRNA基因序列的保守结构分析。
具体实施方式
发明人经过广泛而深入的研究,出乎意料地发现以核糖体RNA为启动子来介导向导RNA的转录,可实现100%的特定基因失活,从而大幅度提高了基因组编辑效率。此外,本发明在基因组定位的编辑或转录调控系统中还具有通用性、简便性以及准确性等有益效果。在此基础上完成了本发明。
本发明首次提出以核糖体RNA为启动子来介导向导RNA的转录,例如采用黑曲霉5SrRNA作为启动子,可实现100%特定DNA位点的切割。由于5S rRNA在不同物种中保守性较强,因此该新型CRISPR/Cas9系统的设计在不同物种中具有更好的通用性,同时与传统的U6启动子相比,由于表达丰度更高使该系统的基因组编辑效率更高。
基因组上特定基因序列的准确编辑,通常在靶基因的上下游选取同源臂,设计构建含同源臂的供体DNA片段供体DNA片段,以此通过同源重组来实现点突变、序列的敲除和敲入。丝状真菌中,DNA修复机制以非同源末端连接(NHEJ)为主,同源重组效率小于5%。因此在传统基因敲除工作中,多通过增加同源臂的长度来提高同源重组效率。在黑曲霉AB4.1中,当同源臂设计为100bp时,基因敲除的效率仅为4%;只有当同源臂达到1500bp时,基因敲除效率才提高至29%。这意味着为完成一个基因的敲除,就需要较为繁琐的供体DNA片段供体DNA片段的构建与非常繁重的转化子筛选工作,如之前粗糙脉孢霉与构巢曲霉的单基因缺失库的构建就花费了10年以上的时间。真核生物中,CRISPR/Cas9系统在基因组特定位点上所引起的DNA双链断裂,在存在供体DNA时,可大大提高同源重组效率。本发明在黑曲霉新型CRISPR/Cas9系统中测试了含有40bp的同源臂的供体DNA片段即可实现对单个靶基因或多个基因的高效插入与敲除,仅需要一个PCR反应即可完成供体DNA的构建,并且仅需验证十个以内的转化子即可获得多个阳性转化子。这将大大简化基因组编辑工作,实现单个基因功能与多个基因关联的快速研究。
由RNA聚合酶III识别的启动子
本文所述的“RNA聚合酶III识别的启动子”是真核生物的RNA聚合酶III识别的启动子。真核生物中有3种依赖DNA的RNA聚合酶,即RNA聚合酶I、II与III。RNA聚合酶I主要负责18S-5.8S-28S rRNA基因簇的转录,RNA聚合酶II负责所有mRNA、大多数snRNA、snoRNA与micro RNA的转录,而RNA聚合酶III则负责5S rRNA、tRNA以及一些小的非翻译RNA(smRNA)的转录。这些小RNA多参与转录、剪接与翻译过程。RNA聚合酶III可识别三类不同的启动子,分别为Type 1、Type 2、与Type 3。Type 1与Type 2启动子为内部启动子,启动子位于基因的内部、转录起始位点的下游,而Type 3启动子则主要位于转录起始位点的上游。已知的Type 1启动子主要是5S rRNA的内部启动子,由A-box、中间元件IE与C-box等转录调控元件组成。
在本发明的具体实施方式中,利用由RNA聚合酶III识别的type 1启动子来起始向导RNA的表达。所述由RNA聚合酶III识别的type 1启动子包括但不限于5S rRNA基因;优选黑曲霉的5S rRNA。在优选的实施方式中,所述5S rRNA基因如SEQ ID NO:6所示。在进一步优选的实施方式中,所述5S rRNA基因的序列如SEQ ID NO:6的1-118位所示。在优选的实施方式中,所述由RNA聚合酶III识别的type 1启动子是5S rRNA的内部启动子。
基于本发明的教导,本领域技术人员应知晓,本文所述的“5S rRNA”、“5S rRNA基因”或“本发明的启动子”具有相同的含义。基于本领域的常规知识以及本发明的教导,本领域技术人员还应知晓,本文所述的“5S rRNA”或“5S rRNA基因”还包括其关键核心元件;即,包含在所述5S rRNA基因内部的核苷酸序列如A-box、中间元件IE与C-box等转录调控元件,并且该核苷酸序列同样能够起到起始向导RNA的表达的核苷酸序列。
CRISPR/Cas技术
本发明所称的“CRISPR/Cas技术”、“CRISPR/Cas基因组编辑”、“CRISPR/Cas基因组编辑技术”、“CRISPR/Cas基因组编辑方法”一般是指利用CRISPR/Cas系统对目的DNA序列进行修改的技术。“CRISPR/Cas技术”也可以包含利用类似原理进行基因表达调控的方法,如基于CRISPR/dCas9的基因表达调控技术。
本发明的向导RNA表达盒
本发明利用真核细胞的RNA聚合酶III识别的type 1启动子(例如5S rRNA)启动CRISPR/Cas9系统中向导RNA的转录,在真核细胞内产生具有生物活性的向导RNA,从而快速实现基因组内特定位点的基因失活、基因插入与基因敲除。
以5S rRNA-sgRNA的结构为例,这种由5S rRNA作为启动子的新型向导RNA表达盒,可转录产生向导RNA,在真核细胞中向导RNA准确识别基因组上的靶序列,指导Cas9蛋白在特定位点进行高效的切割,为基因组定点编辑奠定基础。相比于传统由U6启动子介导的向导RNA表达系统,本发明的结构简单,打靶效率更高,基因组编辑效率更高,在不同真核物种中的普适性更广。
在5S rRNA启动子与向导RNA之间也选择加入可自我切割的核酶所形成的向导RNA表达盒也可起到类似的作用,在本发明中,测试了如HDV与HH等自我切割的核酶,其均可实现向导RNA的转录后加工,生产有活性的向导RNA。
Cas9蛋白
本领域技术人员知晓,CRISPR/Cas的核心是Cas蛋白以及向导RNA。基于本发明的教导,本领域技术人员可以理解本发明的向导RNA表达盒可以与各种Cas蛋白联用,从而用于各种CRISPR/Cas系统,如CRISPR/Cas9系统、CRISPR/nCas9系统、CRISPR/dCas9系统。
Cas9蛋白为多功能蛋白,其蛋白结构包括α-螺旋组成的识别区(REC)、由HNH结构域与RuvC结构域组成的核酸酶区以及位于C-端的PAM结合区。这两个重要的核酸酶结构域RuvC与HNH可分别对gRNA的DNA互补链与非互补链进行切割,产生平末端的DNA双链断裂。当RuvC结构域中的D10A发生突变时可导致RuvC结构域的失活,当HNH结构域中的H840A发生突变时则可导致HNH结构域的失活。单点突变体可使Cas9成为切口酶(nickase),简称为nCas9,可形成单链DNA断裂。目前,CRISPR/nCas9系统也被广泛开发应用,利用两个向导RNA介导的两个单链断裂的形成,可提高该系统打靶的准确性,减少脱靶率。另外,Cas9的双突变体D10AH840A可使Cas9丧失对DNA的切割活性但保留DNA结合活性,从而开发出可被向导RNA介导实现靶向结合的CRISPR/dCas9系统,该系统则可用于基因组靶序列的转录调控。
在具体的实施方式中,所述CRISPR/Cas系统包括但不限于CRISPR/Cas9系统、CRISPR/nCas9系统或CRISPR/dCas9系统;优选地,所述CRISPR/Cas系统是CRISPR/Cas9系统。
核酶
如本文所用,术语“核酶(ribozyme)”具有本领域技术人员通常理解的含义,其是指具有催化活性的RNA分子,即化学本质是核糖核酸(RNA),却具有酶的催化功能。核酶的作用底物可以是不同的分子,有些作用底物就是同一RNA分子中的某些部位。核酶的功能很多,有的能够切割RNA、有的能够切割DNA,有些还具有RNA连接酶、磷酸酶等活性。与蛋白质酶相比,核酶的催化效率较低,是一种较为原始的催化酶。核酶的发现打破了酶是蛋白质的传统观念。
本领域技术人员鉴于本发明的教导,不难理解,本发明可利用各种具有自我切割活性的核酶,包括但不限于HDV核酶、发夹状核酶(hairpin ribozyme)、锤头状核酶(hammerhead ribozyme)等。另外,其它可以自催化切割或通过蛋白因子介导进行切割的核苷酸序列,都可以用于本发明,并且典型地位于本发明的向导RNA表达盒中核糖体RNA和向导RNA之间。在优选的实施方式中,本发明所用的核酶是HDV核酶与HH核酶。
本发明的向导RNA介导的CRISPR/Cas系统
在本发明的向导RNA表达盒的基础上,本发明提供包含所述的向导RNA表达盒的CRISPR/Cas系统。
本领域技术人员知晓,CRISPR/Cas系统可以用于各种领域,包括但不限于基因组编辑、基因表达调控与基因工程等等。在具体的实施方式中,本发明的CRISPR/Cas系统用于基因组编辑和基因表达调控。
本发明的CRISPR/Cas系统包括但不限于CRISPR/Cas9系统、CRISPR/nCas9系统或CRISPR/dCas9系统;优选CRISPR/Cas9系统。
如上所述,本发明的CRISPR/Cas系统的核心是Cas9蛋白以及向导RNA,二者可以在同一表达载体中也可以在不同的表达载体中。然而,由于向导RNA和Cas9蛋白在不同表达载体中减少了向导RNA表达盒亚克隆至Cas9质粒的过程,使得操作更为简便,因此,在优选的实施方式中,将向导RNA的表达盒与Cas9的表达质粒共转化。
基于本发明的技术内容以及本领域的技术常识,本领域技术人员知晓关于Cas9的表达、靶向序列的选择以及DNA转化系统的各种技术要点,例如本领域技术人员可以参照Nodvig等(Nodvig et al.,2015)所述进行Cas9的表达、靶向序列的选择以及实施DNA转化。
在本文中,术语“基因失活”是指在不涉及供体DNA的基础上,由Cas9在向导RNA的引导下对特定位点进行双链切割后,在真核生物中由非同源末端连接系统引入DNA序列插入或碱基缺失等而使得某一基因丧失生物学功能;而术语“基因精准编辑”是指在特定DNA位点进行精准的、可预测的遗传学操作,例如目标DNA片段的敲除、插入、替换、点突变等等,涉及供体DNA以及同源重组机制。因此,本领域技术人员知晓,基因精准编辑的难度要远高于基因失活。此外,本领域技术人员知晓,供体DNA片段供体DNA的长度对于基因组编辑的效率也有很大影响。供体DNA片段供体DNA同源臂长度增加可提高DNA同源重组效率从而提高DNA编辑效率,但多数真核野生菌株中其同源重组的效率很低,有时仅有百分之几的效率,主要是非同源末端连接系统发挥作用。而对于短同源臂的供体DNA片段供体DNA片段,其基因组编辑效率则更低。
然而,本发明的向导RNA介导的基因组编辑系统相比于现有技术具备优异的基因组编辑能力。在具体的实施方式例中,利用本发明的基因组编辑系统获得的基因失活率高于95%,更优选达到100%。
本发明中,“同源臂”具有与本领域技术人员常规理解相同的意义,是指供体DNA上位于靶序列两侧的、与基因组序列完全一致的侧翼序列,用于识别并发生重组的区域。因此,鉴于本发明的内容,本领域技术人员可以自行选择和决定同源臂的长度。同时,本领域技术人员也知晓,利用长同源臂获得的基因组编辑效率通常会高于利用短同源臂的。而相比于现有技术,本发明的显著优点在于可以进行基因精准编辑,特别是利用短同源臂的供体DNA进行基因精准编辑的效率显著提高。
在一优选例中,所述CRISPR/Cas9系统可利用15-3000bp的同源臂的供体DNA进行基因精准编辑;在进一步的优选例中,所述CRISPR/Cas9系统可利用20-200bp的同源臂的供体DNA进行基因精准编辑,例如,供体DNA的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述CRISPR/Cas9系统利用短同源臂的供体DNA进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。
基于5S rRNA在不同物种之间的高度保守性,本领域技术人员基于本发明公开的内容可以合理知晓,本发明的基因组编辑系统可以应用于各物种;所述真核生物包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、牛、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。
特别是,黑曲霉是重要的工业发酵微生物,在工业酶制剂与有机酸发酵方面应用广泛。因为黑曲霉出色的蛋白质分泌能力、强大的复杂多聚物的利用能力、极端的酸耐受性与鲁棒性等特点在本领域中得到尤其的重视。因此,在优选的实施方式中,本发明的基因组编辑系统尤其用于在黑曲霉中进行基因组编辑。
kusA基因失活菌株
在传统研究中,除增加同源臂的长度外,非同源末端连接修复系统(NHEJ)关键基因的失活可提高同源重组(HR)的效率。在黑曲霉kusA基因失活的菌株中,当同源臂为1500bp时,基因敲除效率可由29%提高至98%。但非同源末端连接修复系统(NHEJ)是主要的DNA修复机制,其完全失活后细胞对外界刺激会更加敏感,遗传稳定性降低。kusA基因的暂时失活策略可解决这一问题。在本文中,“kusA基因失活菌株”与“kusA失活底盘菌株”具有相同的含义。
本发明中对NHEJ系统的关键基因kusA进行重新设计,在筛选标记amdS两端各含有一段与kusA同源的同向重复序列,构成基因插入供体DNA片段,以此为供体DNA与Cas9表达质粒、向导RNA-kusA一起共转化黑曲霉AB4.1菌株,从而构建NHEJ失活菌株。以NHEJ失活菌株为底盘细胞,进行后续各种基因组编辑策略的测试。
本发明利用本发明的CRISPR/Cas9系统构建出kusA失活的底盘菌株,进一步提高同源重组的效率。结合kusA失活底盘菌株,在超短同源臂的介导下,本发明的CRISPR/Cas9系统高效快速实现基因组编辑。从而将kusA基因的失活底盘菌株与新型CRISPR/Cas9系统结合后可进一步提升对基因组靶序列的精确编辑效率。
在本发明得到的NHEJ系统失活菌株中,短同源臂介导的基因组编辑具备显著的高效性与简便性。
在具体的实施方式中,利用含有不同长度同源臂的供体DNA对NHEJ系统活性弱化的真核生物,特别是kusA基因失活的黑曲霉进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。在进一步的优选例中,供体DNA的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp;而所述方法的基因组编辑的效率均可以达到100%。在具体的实施方式中,短同源臂因其构建简单而更为优选。
在具体的实施方式中,所述kusA失活底盘菌株包括但不限于真菌的菌株,所述真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉;优选黑曲霉。
本发明的优点:
1.通用性:利用5S rRNA(核糖体RNA)基因本身包含内部启动子的特性,以5S rRNA基因作为启动子起始向导RNA的转录而建立起新型的CRISPR/Cas系统,这种设计思路中,由于5S rRNA(核糖体RNA)在不同物种中保守性强,容易找到和构建,因而在不同物种中开发CRISPR系统时具有更大的通用性。另外,作为向导RNA的新型表达方式,除了在CRISPR/Cas9系统中用于基因组编辑外,也同样在CRISPR/nCas9系统与CRISPR/dCas9系统以及其他借助向导RNA进行基因组定位的编辑或转录调控系统中具有通用性;
2.高效性:利用如5S rRNA作为启动子起始向导RNA的转录,转录活性高,可在体内提供足量有活性的向导RNA,显著提升Cas9的定位与切割效率,从而大大提高基因组编辑效率,为高效基因组编辑技术奠定基础;
3.简便性:利用该新型CRISPR/Cas9系统进行基于同源重组的基因组精确编辑时,可允许超短同源臂介导下的基因组定点编辑,大大减少了同源臂的前期构建工作,提高基因组编辑的简便性;
4.准确性:结合kusA失活底盘菌株,该新型CRISPR/Cas9系统基于同源重组的DNA精准编辑效率可进一步提高,在超短同源臂的介导下也可实现100%的精准编辑。该新型CRISPR/Cas9系统结合kusA基因失活底盘菌株可显著提高基因打靶的准确性,为基因组上的原位定点突变、DNA片段的插入、敲除与替换等基因组高效快速编辑奠定基础。
下面结合具体实施例,进一步详陈本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明实施例中所用的实验材料如无特殊说明均可从市售渠道获得。
除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
实施例1.利用5S rRNA为启动子起始向导RNA表达的新型CRISPR/Cas9系统的建立
本实施例采用黑曲霉的5S rRNA作为启动子,以此来构建向导RNA的表达盒。测试中以聚酮合成酶albA为靶基因,albA参与黑曲霉孢子色素的合成,albA基因失活将导致孢子白化,菌落呈现白色,而albA基因没有失活的菌株呈现为黑色菌落。白化菌落占所有菌落的比例,可以用来代表基因组编辑系统的效率。
1.1靶序列的选择
本发明选择albA基因的以下四个位点作为靶序列,用于新型CRISPR/Cas9系统的基因组编辑效率的检测。具体序列如下:
向导RNA-albA-188:AGTGGGATCTCAAGAACTAC(SEQ ID NO:1);
向导RNA-albA-192:ATTTCCTGACTCGGATGGTA(SEQ ID NO:2);
向导RNA-albA-194:CTGGAGATGATGGGAATAAC(SEQ ID NO:3);
向导RNA-albA-196:TCGCTACCTAATCCTTGAAG(SEQ ID NO:4)。
1.2 Cas9蛋白表达载体的构建
为实现Cas9的核定位表达,在密码子优化后的嗜热链球菌(Streptococcusthermophilus)Cas9的N-端与C-端分别加入SV40的核定位信号(PKKKRKV)与核质蛋白的核定位信号(KRPAATKKAGQAKKKK)。将优化后的Cas9序列(anCas9)克隆至蛋白表达载体中,构建Cas9的蛋白表达载体pCas9,具体载体图谱如图1所示。anCas9的表达盒由启动子PglaA与TglaA终止子组成。
带有核定位信号的anCas9的编码序列如下所示(SEQ ID NO:5):
注:黑色下划线字是密码子-优化的ancas9基因,斜体字表明5’-末端的SV40的NLS序列和3’-末端的核定位信号。
1.3向导RNA表达盒的设计与构建
本发明人采用黑曲霉自身的5S rRNA作为启动子来起始向导RNA的表达,并以此构建向导RNA的表达盒5S rRNA-sgRNA,如图2所示。
5S rRNA-sgRNA序列如下所示(SEQ ID NO:6):
AAACACATACGACCACAGGGTGTGGAAAACAGGGCTTCCCGTCCGCTCAGCCGTACTTAAGCCACACGCCGGGAGGTTAGTAGTTGGGTGGGTGACCACCAGCGAATCCCTTCTGTTGTATGAAAGGACGAAACACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:其中第1-118位表示黑曲霉(A.niger)5S rRNA(An12e05410)基因序列;第119-231位表示向导RNA的骨架序列。第232-237位表示终止子;第140-145与148-153表示BbsI的识别位点(GAAGAC|GTCTTC)。
向导RNA表达盒5S rRNA-sgRNA的构建采用融合PCR的方法完成。引物序列设计如表1所示。将462 bp的5S rRNA序列及其上游序列采用5S-Fm与5S-Rm为引物以黑曲霉基因组为模板进行第一轮的融合PCR。108 bp的向导RNA的骨架序列采用sgRNA-Fm与sgRNA-Rm为引物进行第一轮的融合PCR。第一轮PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。不同U6启动子的gRNA表达盒直接采用人工合成的方法获得。
表1.向导RNA表达盒的构建所用引物
然后将第一轮的PCR产物稀释50倍后,取1ul作为第二轮PCR的模板。以5S-Fm与sgRNA-Rm为引物进行第二轮的融合PCR,获得以5S rRNA为启动子的向导RNA表达盒。第二轮PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。
为方便后续不同靶序列的插入,将获得的向导RNA表达盒克隆至pEASY-Blunt载体,标记为p5S-sgRNA与p5S-HDV-sgRNA,具体图谱如图3所示。
1.4不同靶序列的向导RNA表达盒的构建
构建含有不同靶序列的向导RNA-albA,采用靶序列双链合成后退火磷酸化直接连接至经过酶切与去磷酸化处理的向导RNA表达盒克隆载体p5S-sgRNA中。具体操作如下:
(1)向导RNA表达盒克隆载体p5S-sgRNA的BbsI酶切
首先,将向导RNA表达盒克隆载体p5S-sgRNA进行BbsI酶切,获得其含有特定粘性末端的载体酶切片段。酶切体系为采用Fermentas的BbsI 50μL反应体系,37℃酶切2h。酶切产物进行酶切产物纯化后进行后续操作,大小为4499bp。
(2)p5S-sgRNA BbsI酶切片段的去磷酸化处理
为防止向导RNA表达盒克隆载体p5S-sgRNA的自连,将获得的含有特定粘性末端的载体酶切片段进行去磷酸化处理。去磷酸化体系为采用NEB的CIP 50μL反应体系,37℃酶切30min。去磷酸化产物进行胶回收,大小为4499bp。
(3)靶序列的DNA双链合成
为获得带有粘性末端的不同靶序列,将不同靶序列的双链以引物的形式进行合成,具体引物信息如表2所示。
表2.向导RNA-albA不同靶序列的引物
注:小写字母为与p5S-sgRNA载体进行互补配对的粘性末端,大写字母为不同的靶序列。
(4)不同靶序列单链引物的溶解
向各管引物中加入适当的去离子水,使其终浓度为2nmol/μL。例如,如一管引物含有10nmol的单链DNA,则加入5μL的去离子水。在完成双链退火与磷酸化后,经稀释后可用于连接反应。
(5)不同靶序列的双链退火与磷酸化
由于引物合成后,在其5’-端并没有磷酸化的修饰,所以需在完成双链退火后,进行磷酸化处理。双链退火与磷酸化体系为采用NEB的T4PNK 50μL反应体系,反应条件为37℃磷酸化反应30min;95℃变性5min;缓慢降温至25℃(每min降低5℃)。去磷酸化产物可稀释后直接与处理后的载体酶切片段连接反应。
(6)不同靶序列的寡核苷酸与p5S-sgRNA的连接与转化
将磷酸化后的不同靶序列的寡核苷酸稀释8倍,至终浓度为0.5nmol/μL与去磷酸化处理后的载体酶切片段进行连接反应。反应条件为22℃反应4h。将连接体系转化大肠杆菌DH5α感受态细胞,涂LB/Amp平板。
(7)含有不同靶序列的p5S-sgRNA-albA的菌落PCR与测序验证
挑取单克隆分别以进行不同靶序列的正向引物如albA-188-F与向导RNA骨架的下游引物sgRNA-Rm为引物进行菌落PCR验证,目的条带大小为108bp。挑取阳性单克隆并在LB/Amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建不同靶序列的向导RNA的质粒,其序列均与理论序列相一致。
1.5基于CRISPR/Cas9的多元共转化系统
真菌的DNA转化方法有PEG-介导的原生质体转化法、孢子电击转化法与农杆菌介导的生物转化法。由于PEG-介导的原生质体转化法可以高效地实现多种不同大分子化合物如质粒DNA、线性DNA片段、RNA片段甚至大分子蛋白向原生质细胞的导入。因此本发明采用将Cas9蛋白表达载体与向导RNA-albA片段共转化至原生质细胞中,建立基于CRISPR/Cas9的多元共转化系统,可实现不同靶序列向导RNA-albA的快速验证,提高新型CRISPR/Cas9系统的操作简便性。
(1)向导RNA-albA片段的PCR扩增
向导RNA-albA片段采用以5S-Fm与sgRNA-Rm为引物以p5S-sgRNA-albA为模板进行PCR而获得。引物序列设计如表1所示。PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行PEG-介导的原生质体转化,大小为236bp。
(2)PEG-介导的原生质体转化
按照文献Carvalho et al.2010的方法制备黑曲霉AB4.1的原生质体,然后在冰上向预先冷却的15mL离心管中加入100μL原生质体悬液、10μg pCas9与10μg向导RNA-albA片段,向其加入1mL溶液C(Tris-HCl 10mM,CaCl2 5.54g/L,PEG600050%(w/v),pH 7.5,过滤除菌)冰浴10min,2mL溶液B并混匀后作为实验组。在阴性对照组中,转化体系中不加向导RNA-albA片段,其他操作与实验组相同。向3个融化的上层MMSA试管中各加入1mL上述混合液混匀并立即倒于MMSA平板中,将平板在30℃培养箱中培养3-5d直到长出转化子为止。
1.6不同启动子下的CRISPR/Cas9系统基因组编辑效率的检测
在本发明的CRISPR/Cas9系统中,以albA为测试基因,当以5S rRNA-sgRNA来介导向导RNA的转录时,在初级转化平板上可获得大量转化子,且分别与100%(49/49)均为发生基因失活的转化子,其基因组编辑效率最高可达100%,如图4所示。这表明以5S rRNA为启动子可启动向导RNA高效转录,以保证胞内向导RNA的丰度。
为进一步测试Cas9介导的基因组编辑系统,明确不同靶序列对基因失活效率的影响。针对albA的不同外显子进行靶序列的设计,在第三外显子中选取了三个靶序列,在第五个外显子中选取了一个靶序列。利用黑曲霉新型CRISPR/Cas9系统进行突变检测,结果发现对不同位点的基因失活效率均可达到100%,如图5所示。
实施例2.利用5S rRNA-核酶-向导RNA表达盒的新型CRISPR/Cas9系统的建立
为测试HDV核酶的作用,设计了以5S rRNA作为启动子,中间添加HDV为核酶完成向导RNA转录的自我加工,以此来构建向导RNA的表达盒5S rRNA-HDV-sgRNA,如图2所示。为测试HH核酶的作用,设计了以5S rRNA作为启动子,中间添加HH为核酶完成向导RNA转录的自我加工,以此来构建向导RNA的表达盒5S rRNA-HH-sgRNA,如图2所示。5S rRNA-HDV-sgRNA与5SrRNA-HH-sgRNA表达盒的构建采用融合PCR的方法完成。引物序列设计如表1所示。具体构建与黑曲霉转化过程如前所述,不再赘述。
5S rRNA-HDV-sgRNA序列如下所示(SEQ ID NO:21):
ACATACGACCACAGGGTGTGGAAAACAGGGCTTCCCGTCCGCTCAGCCGTACTTAAGCCACACGCCGGGAGGTTAGTAGTTGGGTGGGTGACCACCAGCGAATCCCTTCTGTTGTATGGGACAACGAAATCGGCCTCTGCAACCTCCACGTGGTGTTGTCTGGGAACCTGATCAAAACTACCGAGTTTGATCAGGCCAATGCAGAGAAAGGACGAAACACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:其中第1-118位表示黑曲霉(A.niger)5S rRNA(An12e05410)基因序列;第119-206位表示深绿木霉(Trichoderma atroviride)drz-Tatr-1核酶基因HDV(BK006897.1);第207-315位表示向导RNA的骨架序列。第316-321位表示终止子;第224-229与232-237表示BbsI的识别位点(GAAGAC|GTCTTC)。
5S rRNA-HH-sgRNA序列如下所示(SEQ ID NO:22):
ACATACGACCACAGGGTGTGGAAAACAGGGCTTCCCGTCCGCTCAGCCGTACTTAAGCCACACGCCGGGAGGTTAGTAGTTGGGTGGGTGACCACCAGCGAATCCCTTCTGTTGTATGNNNNNNctgatgagtccgtgaggacgaaacgagtaagctcgtcCACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:其中第1-118位表示黑曲霉(A.niger)5S rRNA(An12e05410)基因序列;第119-124位表示HH核酶中需与靶序列互补配对的六个碱基;第115-161位表示HH核酶基因(KJ796498.1);第162-259位表示向导RNA的骨架序列。第260-265位表示终止子;第168-173与176-181表示BbsI的识别位点(GAAGAC|GTCTTC)。
在本发明的CRISPR/Cas9系统中,以albA为测试基因,当以5SrRNA-HDV-sgRNA来介导向导RNA的转录与后加工时,在初级转化平板上可获得大量转化子,且分别96.16%(101/105)均为发生基因失活的转化子,其基因组编辑效率最高可达100%,如图4所示。当核酶为HH核酶时,也可成功实现向导RNA的加工编辑,其基因组编辑效率也可达到93.75%(15/16)。这表明当向导RNA的表达盒中存在HDV核酶或HH核酶时,均可成功实现向导RNA的转录后加工,获得有活性构象的向导RNA,引导Cas9蛋白结合到特定位点实现高效的切割。
比对例1.利用U6启动子起始向导RNA表达CRISPR/Cas9系统
为与传统的U6启动子的效率进行比较,本发明人同时设计了一系列不同来源的U6启动子来介导向导RNA的转录,将来源于人类的hU6序列在黑曲霉基因组与NCBI数据库中进行BLAST。然后选取来源于人类的hU6、来源于酵母的yU6以及黑曲霉自身的anU6的启动子起始向导RNA的体内转录,以此分别来构建向导RNA的表达盒PhU6-sgRNA、PyU6-sgRNA与PanU6-sgRNA,如图2所示。
PhU6-sgRNA序列如下所示(SEQ ID NO:23):
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAAGGACGAAACACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:第1-253位表明人的RNU6的启动子区域;第254位表明转录起点;第255-351位表明向导RNA的骨架序列;第352-357位表明RNU6基因的终止子;第260-265与第268-273位表明BbsI的识别位点。
PyU6-sgRNA序列如下所示(SEQ ID NO:24):
GATCGATAATTCTCCATAATAGTTCTGTTATTTATAATCTCCAGCACTAATAAATGCTATACGTATATTTGTACACAATATAATTTCAGAATTTATATTGCTACCATGACTGTCTGAGAATTGGGGGAATAACTTGATAATTGTTGGGATTCCATTGTTCGTAAACGCAATAATATTAGGTATATAGAAGATACTAAATGTTCTCTCCGAGGATATAGGAATGCTCACAATGGAATCGATATATTTCTACATAATAGTATTGAGATTATTCCTCTTTTAGTTTTATATAATTCATTATCCTATTACATTATCAATCCTTGCATTTCAGCTTCCATTAGACTTAATGACTGTTTCTCAATTTTTATGTCATCTTCCTGGACCTCATGTGATACTATACCAGTAGCATGAATACTACTGAATCGATGATACTTTAGAGTTTCATTGCAACAGTTTCAACACAGCCTGGCATGAACAGTGGTAAAAGTATTTCGTCCACTATTTTCGGCTACTATAAATAAATGTTTTTTTCGCAACTATGTGCACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:第1-539位表明酵母菌的RNU6的启动子区域;第540位表明转录起点;第541-638位表明向导RNA的骨架序列;第639-644位表明RNU6基因的终止子;第547-552与第555-560位表明BbsI的识别位点。
PanU6-sgRNA序列如下所示(SEQ ID NO:25):
CCCAAGCTTGATCGATAATTCGCCATGGCGGCCGCGGGAATTCGATTCCCAAGCTTGATCGATAATTCTCCATCCTGCTCAGACCTCACCACCCCGGAGCAGCCGCGTCGTAGCAACCATCAGCTTCCATTAAGACTAATGACTGTTTCTCAATTCTTTATGTCATCTTTCCTGAGGACCGGCCTAGAGCGGAAACACATGTGCAGATCCCTTCATGTGATACTATACCAGTAGCATGAATACCTACTGGGCATTGGCGGTTTAATCGATGATACTTTAGAGTTTCATGGCAATCAGCAACAGTTTCAACAACCGCCGGTATAAGGCATGAACAGTGGTCAAGTCCGCTGTAAAGTATTTCGTCCTACTATCTCGGCTACTATAAATAAATGTTTTTTCGATCTATGTGCACCggGTCTTCgaGAAGACCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT
注:第1-408位表明黑曲霉的RNU6的启动子区域;第409位表明转录起点;第410-507位表明向导RNA的骨架序列;第508-513位表明RNU6基因的终止子;第416-421与第424-429位表明BbsI的识别位点。
值得一提的是,在选择U6启动子的过程中,虽然在NCBI数据库中检索到一条黑曲霉的U6snRNA序列,但在黑曲霉CBS513.88中未能检索到U6snRNA序列,这表明U6snRNA的基因序列即使在同一物种的不同菌株中由于基因组注释的限制而存在无法有效鉴别的问题。采用来源于人类的hU6snRNA(p330)、来源于酵母的yU6snRNA(X12565.1)以及黑曲霉自身anU6snRNA(AY136823.1)的启动子起始向导RNA的体内转录,所构建的CRISPR/Cas9系统,在初级转化平板上所获得的转化子分别为23.33%(7/30)、20%(1/5)、23.07%(3/13),如图4所示,与实施例1和实施例2相比,初级转化子明显偏少,且发生基因失活的转化子更少,表明其基因组编辑效率较低。通过比对可见,采用本发明的5S rRNA启动子构建的CRISPR/Cas9系统,其基因失活效率提升了五倍,达到100%。
实施例4.超短同源臂介导下CRISPR/Cas9系统的基因组定向插入编辑
在本发明的CRISPR/Cas9系统的基础上,本发明实现了超短同源臂介导的基因组精准定位编辑,大大简化了基因精确编辑中供体DNA片段的构建工作。在本实施例中,展示以40bp同源臂介导在albA基因特定位点靶向插入一段DNA序列。
4.1 albA基因供体DNA片段的设计与构建
供体DNA片段MHAi-albA-hph携带有潮霉素抗性基因hph表达盒PtrpC-hph-TtrpC,供体DNA片段上下游各有一个albA基因的同源序列,称为同源臂,长度分别为40bp。两个同源臂在albA基因中的同源位置分别紧邻Cas9切割位点albA-188的上游与下游,具体设计与序列位置如图8所示。
MHAi-albA-hph序列如下所示(SEQ ID NO:26):
CCTCCGCCTCCCAGCCTACAAGTGGGATCTCAAGAACTACgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggttATTCCCTATACCAACAACTTCTGCCTGAGCAAGGGCGCTC
注:下划线标出albA-188的5’侧翼区域和3’侧翼区域;小写字母表明PtrpC-hph-TtrpC表达盒。
MHAi-albA-hph的构建采用一步PCR的方法来完成。引物序列设计如表3所示。直接以MHAi-albA-F与MHAi-albA-R为引物以pSilent-1为模板进行PCR扩增,来获得供体DNA片段MHAi-albA-hph。PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行PEG-介导的原生质体转化,大小为1978bp。
表3.MHAi-albA-hph的构建所用引物
4.2超短同源臂介导的基因精准编辑效率的检测
将含有超短同源臂的供体DNA片段MHAi-albA-hph、实施例1中构建的Cas9表达质粒、向导RNA-albA188一起共转化黑曲霉AB4.1菌株,过程原理如图6A所示。黑曲霉AB4.1菌株的原生质体制备和转化方法参考实施例1之1.5所述,在转化体系中除100μL原生质体悬液、10μg pCas9与10μg向导RNA-albA片段外,再加入10μg供体DNA片段MHAi-albA-hph,其余操作均相同。转化的平板为不带潮霉素的MMSA培养基平板。3天后平板上白化菌落占所有菌落的比例为95.68%(111/116)。通过联合使用插入片段内部和外部的引物对随机挑选的转化子进行基因组的PCR检测,结果表明,CRISPR/Cas9系统介导的同源重组可达到75%(图6B)。DNA测序数据表明,供体DNA片段非常准确地定位在所设计的同源臂处,未出现其他片段的插入或DNA碱基缺失的现象。这是首次在黑曲霉中成功使用短同源臂实现基因插入失活,且效率非常高。采用短同源臂进行基因的插入失活,可大大减少长同源臂的供体DNA片段的构建工作量,仅需用带有短同源臂的引物对筛选标记进行扩增即可。
实施例5.基于Cas9基因与向导RNA表达盒整合质粒的基因组编辑
在CRISPR/Cas9系统中,Cas9基因、向导RNA表达盒等可以分别以独立的片段进行共转化,也可以构建为整合质粒。本发明测试了基于Cas9-向导RNA整合DNA片段的CRISPR/Cas9系统在基因失活与基因插入的编辑效率。下面具体针对albA基因的特定位点3S196的基因失活与靶向插入为例,进行论述。
5.1整合DNA片段的设计与构建
将向导RNA-albA-188的表达盒克隆至Cas9的表达质粒pCas9上,构建整合质粒pCas9sgRNA,具体设计如图7所示。
质粒pCas9sgRNA的构建采用ClonExpressTM MultiS多片段一步克隆试剂盒(Vazyme,C113)将向导RNA-albA-188表达盒的PCR产物直接重组至pCas9的SbfI酶切片段中来完成。引物序列设计如表4。
表4.整合质粒pCas9sgRNA的构建所用引物
首先,以5SrRNA-Fm2-sbfI与向导RNA-Rm2-sbfI为引物,以p5S-sgRNA-188为模板进行PCR扩增,获得向导RNA-albA-188表达盒。PCR产物进行PCR产物纯化后进行后续操作,向导RNA-albA-188大小为327bp。将Cas9表达质粒pCas9进行SbfI酶切,获得其含有特定粘性末端的酶切片段。酶切产物进行纯化后进行后续操作。将纯化后的向导RNA-albA-188的PCR片段与pCas9的SbfI酶切产物,采用ClonExpressTM MultiS多片段一步克隆试剂盒进行一步重组反应。然后将连接体系热激转化大肠杆菌DH5α感受态细胞,涂LB/Amp平板。
5.2基因组编辑效率的检测
在针对albA的特定基因位点失活的基因组编辑中,直接将含有向导RNA-albA-188表达盒的质粒pCas9向导RNA转化至黑曲霉菌株AB4.1中。原生质体的转化方法如实施例1之1.5所述,转化体系为100μL原生质体悬液与10μg pCas9向导RNA,其余操作均相同。结果表明,与向导RNA-albA-188表达盒的PCR片段与pCas9质粒共转化的结果相似,在初级转化平板上也可获得大量转化子,在106个转化子中,仅有5个转化子为未发生编辑的黑色菌落,基因失活效率可达95.28%(101/106)(图8A)。
测试超短同源臂介导下质粒pCas9向导RNA的DNA精准编辑效率。将pCas9向导RNA质粒与超短同源臂albA基因供体DNA片段MHAi-albA-hph进行共转化。原生质体的转化方法如实施例1之1.5所述,转化体系为100μL原生质体悬液、10μg pCas9向导RNA与10μg MHAi-albA-hph片段,其余操作均相同。结果表明,在初级转化平板上,获得86个转化子,仅1个为黑色孢子,基因组编辑效率为98.85%(图8B)。采用hph-F/hph-R对随机挑选的8个白色转化子进行基因型验证,结果如图8C所示,在8个转化子中有6个发生了精确的同源重组,这表明Cas9-向导RNA整合系统在野生型的菌株中基因精准编辑效率为75%,与实施例2中Cas9、向导RNA共转化的CRISPR/Cas9系统的效率相似。
实施例6.利用新型CRISPR/Cas9系统构建kusA失活底盘菌株
在真菌中,非同源末端连接系统NHEJ的失活可大大提高同源重组效率,但会影响细胞对外界刺激的敏感性。本发明对NHEJ系统的关键基因kusA进行改造,供体DNA包含了筛选标记amdS基因,在供体DNA两端各有一段kusA的同源片段,以此为供体DNA,与Cas9表达质粒、sgRNA-kusA表达盒共转化黑曲霉AB4.1菌株,从而构建NHEJ失活菌株。以NHEJ失活菌株为底盘细胞,进行后续各种基因组编辑策略的测试。
6.1 kusA失活供体DNA片段的设计与构建
NHEJ系统的关键基因kusA的失活供体DNA片段LHAi-kusA-amdS的设计为在筛选标记amdS两端含有kusA的上下游同源臂基因插入供体DNA片段。
LHAi-kusA-amdS序列如下所示(SEQ ID NO:31):
ATTCGCCTCTTCCATGACTTCGAGATCCAGCTCATACAGGGTCTCAATGTGGTCGCTGGTGAAGGCGATCGGTACGA GGACAATGTCGGTCTGTCCACGCTTCACGTACTCTTGGACGGTATCGCTTGTCTGCGCTCCCAGCCAAGCCCTTGGT CCGACCTGAGACTGCCAGCAGAGGCGGTAAGGGTTGCTAAAATTGAGCCTTTGCATCACCGCATGCACTGTTGCCGC AACCTCGGCCGGGTATGGATCACCTAAAGGAGAAGTTGTCGGTTAGCTACCGGGAGTTGGTCACCAAGACCCTTGAG ACTCACCTCTGTTCACAACACTCATGGGCAAACTGTGGGCCGAGAACAAGAGAACCACTCCATTTCTCTTATCTTCC GGATAGGTTTTGAGTTGATCCTCAATGTTTCTCGCAAACGCCTCCACAAGGCCAGGGTGCGTAGGCCATCTGTCGAT AACGCTCCACTGGATAGCTCCGGAAGTGTCCACGTTTCCGTTTGCTCGCTTGCCCTCCAGCCGATTCCTCCATTTCC ACAGCTCATTCAGAGAGCTACCCGTAGTAGAACAGGAATACTGGGGGTATTGTGAGAACGCGACCGCACGACCGCCC TTCCCATTGCCAAAGCCATCTTCCAGCAATTGTGTGTACATTTGTTCCGTCAGCGGGTTGGCGTAACGGAAGGCAAC GTACGGCTTGTGAGGCGCAGTCTCCGGGTTGATCTTGTCCAGCAGCTTGCACATTTCCTTGCATTGGTATTCCGACC ATTTTCTTATGGGTGAGCCTCCGCCGATGTCCGCATACTGCTTTTGAATCTTGGGTGTGCGTCGTTTCGAAATAAGA GGCCCGAGGTAATGCTGGAACTTGCCAAGAGGAATCAAATCGCCGTCGGCCTTGAATAGAAGTAGAATGTTAGAAAC GTAGCAACCAGAATGACAGCTTGCCATAGTCGGAGACGTACAAAGAGCCGGCTGAGGAAATCCTCTACTTCGTCTGT CGTCGAGGGCCCTCCCATGTTCAGGAAGACCATGGCTGTAGGGCCCTTAGAGCCTGTTGCATCCTGGGTAACCGGAG GCACTGTTGTTGCCAGCCCACATCTTTGTTCTTGCTTGTATCCGAACAGGGTGCGAGAAGCCGGTCGCAGCAATTGC CGGGGCAGGGTAAACGGGCGGCGGAGAGCCATGACAGGTAATTGTACTGAATTCGGTTGACCTAGTCAATGGAGGTA ATAAGAAAAGACCGTTCGTATCGCGCAAGCAGATGAACTATTCACGCCGCATTAAATATTCAAAAGATAGACGAGTG GCAAGAACAGGTAGTGGGTGTATACAACAGCGCAAGGCCTTCTGGAAGCTGAAAAGTCCAGAACGGCTTGATGACGG AGCACCGAGACCACGACCAACTCCGACTCCCGACAGCCAATGACCGGCCAGCTAGCGTCATCAATTACCGGGCGGAC ATCACATGATGTTCGTGTCTCCCCGCGTCTTTCTGCCCACCGGTTTGATCGCGTCCCTCGCGACCGGATCCAGTGAC GATATAGATAGATCTATCTCCGGCTGCAGGCAGCAGAGGCCAAACAGGCAGACACAACAGCCCCACTTGTTCCTGGT TACGATTCAAGTTGTCTTAACCTTTATACTTCCCTCTTTCAATTTCGATAATATCTTGAATGCTTTAAACGATTCCA CAACATTCTACTATGGCGGACGGCAACCCACATCGGGAAGATGAGGCGGCCGAGGAAGAAGAGGAGATTGATGAGAC TGTACGCAAATTTACCCATGAACTTGGACTGGAACTCTGGAACTGACAATAAGATCAGAGCTACAAACCAGTCAAAG ATGCGGTCCTCTTCGCAATCGATGTCAGCGATTCCATGTTGAttttgaatagctcgcccgctggagagcatcctgaatgcaagtaacaaccgtagaggctgacacggcaggtgttgctagggagcgtcgtgttctacaaggccagacgtcttcgcggttgatatatatgtatgtttgactgcaggctgctcagcgacgacagtcaagttcgccctcgctgcttgtgcaataatcgcagtggggaagccacaccgtgactcccatctttcagtaaagctctgttggtgtttatcagcaatacacgtaatttaaactcgttagcatggggctgatagcttaattaccgtttaccagtgccgcggttctgcagctttccttggcccgtaaaattcggcgaagccagccaatcaccagctaggcaccagctaaaccctataattagtctcttatcaacaccatccgctcccccgggatcaatgaggagaatgagggggatgcggggctaaagaagcctacataaccctcatgccaactcccagtttacactcgtcgagccaacatcctgactataagctaacacagaatgcctcaatcctgggaagaactggccgctgataagcgcgcccgcctcgcaaaaaccatccctgatgaatggaaagtccagacgctgcctgcggaagacagcgttattgatttcccaaagaaatcggggatcctttcagaggccgaactgaagatcacagaggcctccgctgcagatcttgtgtccaagctggcggccggagagttgacctcggtggaagttacgctagcattctgtaaacgggcagcaatcgcccagcagttagtagggtcccctctacctctcagggagatgtaacaacgccaccttatgggactatcaagctgacgctggcttctgtgcagacaaactgcgcccacgagttcttccctgacgccgctctcgcgcaggcaagggaactcgatgaatactacgcaaagcacaagagacccgttggtccactccatggcctccccatctctctcaaagaccagcttcgagtcaaggtacaccgttgcccctaagtcgttagatgtccctttttgtcagctaacatatgccaccagggctacgaaacatcaatgggctacatctcatggctaaacaagtacgacgaaggggactcggttctgacaaccatgctccgcaaagccggtgccgtcttctacgtcaagacctctgtcccgcagaccctgatggtctgcgagacagtcaacaacatcatcgggcgcaccgtcaacccacgcaacaagaactggtcgtgcggcggcagttctggtggtgagggtgcgatcgttgggattcgtggtggcgtcatcggtgtaggaacggatatcggtggctcgattcgagtgccggccgcgttcaacttcctgtacggtctaaggccgagtcatgggcggctgccgtatgcaaagatggcgaacagcatggagggtcaggagacggtgcacagcgttgtcgggccgattacgcactctgttgagggtgagtccttcgcctcttccttcttttcctgctctataccaggcctccactgtcctcctttcttgctttttatactatatacgagaccggcagtcactgatgaagtatgttagacctccgcctcttcaccaaatccgtcctcggtcaggagccatggaaatacgactccaaggtcatccccatgccctggcgccagtccgagtcggacattattgcctccaagatcaagaacggcgggctcaatatcggctactacaacttcgacggcaatgtccttccacaccctcctatcctgcgcggcgtggaaaccaccgtcgccgcactcgccaaagccggtcacaccgtgaccccgtggacgccatacaagcacgatttcggccacgatctcatctcccatatctacgcggctgacggcagcgccgacgtaatgcgcgatatcagtgcatccggcgagccggcgattccaaatatcaaagacctactgaacccgaacatcaaagctgttaacatgaacgagctctgggacacgcatctccagaagtggaattaccagatggagtaccttgagaaatggcgggaggctgaagaaaaggccgggaaggaactggacgccatcatcgcgccgattacgcctaccgctgcggtacggcatgaccagttccggtactatgggtatgcctctgtgatcaacctgctggatttcacgagcgtggttgttccggttacctttgcggataagaacatcgataagaagaatgagagtttcaaggcggttagtgagcttgatgccctcgtgcaggaagagtatgatccggaggcgtaccatggggcaccggttgcagtgcaggttatcggacggagactcagtgaagagaggacgttggcgattgcagaggaagtggggaagttgctgggaaatgtggtgactccatagctaataagtgtcagatagcaatttgcacaagaaatcaataccagcaactgtaaataagcgctgaagtgaccatgccatgctacgaaagagcagaaaaaaacctgccgtagaaccgaagagatatgacacgcttccatctctcaaaggaagaatcccttcagggttgcgtttccagtctagCGCCTCGCCCCTCAGCAGATCCTAAGAAACAC ACCCAAGAATCACCCACCACGGCAGCGCTCAAATGCGCCTATCACTTCATGCAACAACGAATCATATCAAATCCACA AGACATGATGGGTGTTTTGCTGTTCGGGACCCAGGCGTCCAAGTTCTTTGAAGAAGATGAAGACAGTCGGGGAGACC TGTCCTACCCCAACTGCTACCTCTTCACTGATCTGGATGTTCCTTCGGCTCATGAGGTCAAAGAACTTCGAGCACTG GTAGATGATGAAGGAGACTCAAGGGAGGTTCTATCTCCAGCGAAAGAGCAGGTCTCTATGGCAAACGTCCTATTTTG CGCCAACCAGATATTCACATCCAGAGCGCCAAATTTCCTCTCCCGGCGTTTGTTCATCATAACCGACAATGACAACC CCCATGGTGATGATAAAACCCTGCGGTCAGCGGCGACTGTACGTGCTAAGGATCTTTACGATCTTGGTGTCACAATT GAGCTGTTTCCGATCTCACGCCCTGAGCATGAGTTCAAGAACAGCAAGTTCTATGACGTAAGCTATCATACTCTATA GCAAAGTGGCAGGGGTCGATACTCACTACAGATACAAAGGATATTATCTACAAGTCATTGCCCAGCGATCCAGAGGC GCCTGCATATCTACAATCTGATTCAAAAGCGGCGACTGCGACCGGGGACGGGATTTCACTCCTCAACACGCTTCTGT CCAGTATTAATTCGAGAACGGTTCCGCGTCGCACTCATTTTTCGAACATGCCTTTAGAACTTGGCCCAGACTTCAGA ATTTCGGTATCGGGCTATATACTCTTACGAAGGCAAGCGCCCGCTAGAAACTCCTTCATCTGGCTGAACGGCGAGAA GCCTGTGGTCGCGAAAGGAGTGACTTCCCACTCCGCAGATGATACTGGCCGGACTGTCGAGAAATGGGAGATCAGAA AGGCATATAAGTTCGGTGGCGACCAAGTAACCTTTTCGCCTGATGAGCAGAAGGCGCTTAGGGATTTCGGTGAGCCA GTAATCCGGGTTATTGGGTTCAAGCCTATCACTGCGCTTCCATTCTGGGCAAACGTCAAGCACCCATATTTTATCTA TCCATCCGAGGAAGACTATGTAGGCTCCTCGCGAGTATTTTCCGCATTGCATCAGACTCTTTTGCGTTCCAAGAAGA TGGCACTCGTCTGGTTCATTGCACGCAAGGGTGCTGGCCCCGTTCTCGCCGCTATGATCGCAGGCGAAGAAAAGCTT GATGAGAATGGCGTACAAAAATACCCTCCTGGCATGTGGATTCTTCCCCTCCCCTTCGCAGACGATATCCGGCAGAA CCCCGAAACAACGTTGAATGTCGCCCCGGAGTCATTGATTGATCAGATGCGCGTGGTCGTCCAGCAACTGCAGCTGC CGAAGGGAGTGTACGAGCCTCTCAAATACCCCAATCCATGTAAGTCACTGCTGTCTTGCATTGCTCGTATACGATGA ACGAGAAGTTGACAGCCCGTGATCAGCCCTTCAATGGCATTACCGCATCCTACAAGCTCTCGCATTAGACGAAGATC TCCCTGAAAAACCAGAAGACAAAACCATTCCGAAATACCGCCAAATCGACAAGGTAAAACCACTACACCCAAGAAAC AACCCTCCACGCATTCAACCTACTGACAATTGCACCGCAGCGCGCCGGTGACTACGTATTATCCTGGGCCGACGAAC TCGAAAAGCAATACGCCAAAACCTCAGCAGCGGCCCCTCGCCCAACCAGCACCCTCGTGAAACGAGGATCAAAAGAC CGAGCAAGCGAAACCGAGGACTCCAAG
注:下划线字表示kusA的5’侧翼区域和3’侧翼区域;黑色小写字母表示PglaA-amdS-TtrpC表达盒。
6.2kusA失活供体DNA片段的构建
kusA的失活供体DNA片段LHAi-kusA-amdS的构建先采用ClonExpressTM MultiS多片段一步克隆试剂盒(Vazyme,C113)来完成多片段体内拼接,构建出无同向重复序列的供体DNA片段;然后再采用酶切连接的方法将同向重复序列插入至amdS的下游,完成整个供体DNA片段的构建,具体设计如图9A所示。引物序列设计如表5所示。具体操作如下:
(1)各供体DNA片段的PCR扩增
首先,以kusA-up-Fm与kusA-up-Rm为引物,以黑曲霉基因组为模板进行PCR扩增,获得供体DNA片段的上游同源臂kusA-up;以kusA-down-Fm与kusA-down-Rm为引物,以黑曲霉基因组为模板进行PCR扩增,获得供体DNA片段的下游同源臂kusA-down;以amdS-F与amdS-R为引物,以pGm为模板进行PCR扩增,获得供体DNA片段的筛选标记amdS的表达盒。引物如表5所示,PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行后续操作,kusA-up大小为1890bp,kusA-down大小为1830bp,amdS的表达盒大小为2621bp。
表5.LHAi-kusA-amdS的构建所用引物
(2)载体pEASY-Blunt的反向PCR
以pEASY-Blunt-F与pEASY-Blunt-R为引物,以p5S-sgRNA为模板进行该载体的反向PCR扩增,获得pEASY-Blunt的线性化载体骨架。具体引物序列如表5所示,PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行后续操作,pEASY-Blunt的线性化载体骨架大小为3830bp。
(3)各DNA片段与pEASY-Blunt线性化载体的重组与转化
将纯化后的各PCR产物kusA-up、amdS的表达盒与kusA-down共同与pEASY-Blunt线性化载体采用ClonExpressTM MultiS多片段一步克隆试剂盒进行一步重组反应。反应条件为37℃反应30min。然后将连接体系热激转化大肠杆菌DH5α感受态细胞,涂LB/Amp平板。
(4)打靶载体pLHAi-kusA-amdS的菌落PCR与测序验证
挑取单克隆分别以pEASY-Blunt的载体引物如M13F与M13R为引物进行菌落PCR验证,目的条带大小为6389bp。挑取阳性单克隆并在LB/Amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建针对kusA的打靶质粒,其序列均与理论序列相一致。
4.3向导RNA-kusA-198表达盒构建
针对kusA基因设计了其靶序列kusA-198,的双链以引物的形式进行合成,具体引物信息如表6所示。p5S-sgRNA的BbsI酶切与去磷酸化、靶序列的引物溶解、双链退火与磷酸化以及连接转化等分子实验操作如实施例1.4所述。
表6.kusA-198靶序列的引物
4.4kusA失活底盘菌株的构建
以pLHAi-kusA-amdS为供体DNA,与Cas9表达质粒与向导RNA-kusA-198共转化黑曲霉AB4.1菌株。随机选取10个转化子,以amdS内外引物进行PCR扩增。结果表明,本发明的CRISPR/Cas9系统成功实现了野生型AB4.1菌株kusA的插入失活,其精准基因组编辑效率可达到80%以上,如图9B所示。由测序结果可见,供体DNA片段非常准确地定位在所设计的同源臂处,并无其他未知DNA的插入或个别碱基的丢失与插入。
实施例7.kusA失活底盘菌株中长同源臂介导下新型CRISPR/Cas9系统的基因组编辑
在本发明CRISPR/Cas9系统的基础上,针对大片段的基因敲除,本发明设计采用双向导RNA-albA的策略,通过Cas9同时在两个位点的切割,为同源重组提供游离的DNA末端,增加与供体DNA的可及性,来实现了超短同源臂介导的基因组精准定位编辑。为进一步的提高同源重组的效率,在kusA失活底盘菌株中实现了特定位点的大片段DNA的精确敲除。在本实施例中,以同源臂的长度设计为2.5kb的长同源臂打靶片段,结合kusA失活的底盘菌株,利用本发明的CRISPR/Cas9系统在albA基因特定位点进行大片段DNA敲除。
7.1长同源臂的大片段DNA敲除打靶片段的设计
长同源臂albA大片段DNA敲除打靶片段LHAd-albA-hph序列中,上下游同源臂位置分别分别位于albA基因的上游与下游,上游同源臂位于靶序列albA-192的上游1163bp与靶序列albA-196下游,具体设计与序列位置如图10所示。
LHAd-albA-hph序列如下所示(SEQ ID NO:42):
ACTGTAGCAGCGGAGTAAGATGGAAGGTTGTCATTCCAGCCAGGCTCGAGGATACACGTGCCACCCACAAGTTTACG ACCCAACCTGGAACACGCTAGTCTAGTAAATCACCTGGCAGTTTTCTCAACCGGGCGTTAGATTGCGCTTGTCTACA ATTAATACTGTACAGCGAAATTTGTCTTCTATTGTGTGACATCAACTAATAGTCCAGGTCTCATGATGCTTACTGGC ACAGGTATCCGACCAAAGAAGTTCTTCCTTCGGAAGTATGGGTGGAAGGGTACGCGGTTCGGAAAAGTCTCTGCAGC GTCGACAACAGAACCACCAAGGTTCACGAGAGGCTCACGCCAAGTAACCTTATTGAGACCCGTATCCGGGATGGCTG GTACCAGATGGCTTGTGTGCTACTTCTTATTGACAGTAAGCGTCTTTGTCGATTGTGTTTGCTCGCTCCTGCGTACG GAGGATTGTAAGCTGATAGTCTCGTGGACCATAACGTGACATGATATTCCAGGAAATCAGAGAGCTGACAAATACAT CTGAACCTGCTAGATAGGCCTACGTTGTCTTCTGTATCCTTTGCTGAGACATGTTTGGGATTATCCTCCATTGTTAA GGGTTTCCGAAGCCGAGGGATATGCACTATATTTATCGGACCACACATGATCCTTGAGCAAACCACTGCTCCTATGA CTAAGAACGCTTGATAAACCCACTGCGAGGCTTTTCGGGAGAGGCTTGGCAATGTCTCACTACCAGATCATAGGGAT ACCGCCTCTTGGTTCATACTTCCTGCATTGGCTTCTTCTGCAAACAGCCCATTTTCAGCTGTCTAGCCTGACCATGC TGACCGTAATGAGGGATAACAATAGGCTTGAAAGTTGCTGATGGTGTGTAAGATTGACTAACCTCTAGGAATACTTA TGAAAATGCCAACTCAGAACAAATTTGGACCGCAATGGCACGAGTGGAACGCAGGGTGGCAGCACGGCTTATGAACC TTATCAATGCGACGCCTCGAGAGGGGCCTCAAATACCTGTCTAGGATCACACATTCTCGGAGGTTAAAGTTCTAGTT TGGTTATTCGGGCGAGTTATTGAACCTTGACATTTGTGGGACACATGTCAAGCATGACCCGCCACTCGAATGGAAGG TTCGGTGGCTGAAGCAAATTTGAGACGATCCTGATTCAACACAAACCCCTCGAGCCCTGCCATCAGAGCTGTCCGAG CACGGTGTGCAAGAGCTCTGCCAGTTAAACTACTCAGTACTAGCCAAATGGTACTCAGCATGTTGGTTATATATTCG AGCATCATGCAGGGTTTCAAACCAGGGGAAGGAGTGCAGAGTCGAGTCGAACCTGCAGGATACTGAACAAGCCGTGA ACTAAAACAGTTCATATCCCTAGCAAGGCAAATGAACCGGCCATGCTCGAGAACCGGGTAGATATGGCAGGAAGAAT GATCCGTCGGTCAGGCTGCTTCGAGCATGTCATGTCACCACTACTACTCCACCGACTACATTCCAGCAACAATAACC TTGTTTCTCCAGACATCGTTCGCTGACTAGTTTGTCCGAGTTTCGGAAGTTGAATAAGCCAACATACACTTCGGGGG ATCTCGTTGGTAGAAAACGCAAGGTACATGCAGGGCAGCAGGGCACGGATCTTGACTGCCTGGTCTTTCGGCATGCG TCTTTCTGCGTCTTTCCCACCGATATCATCGGCGAAGCGAGAAATCCTTCGGCCTGGCCCGTGGAATTTTGTGTCTC ATGCCTAGGGAGGAAAGATGTTAGGGGAATCTTCACCCCAGACTTCTTTGTCGTTTGTCACGTGCTCGCTGCAACCT GCTGATCGTCGCCAAATGGGGCGGCGACGACTTTCCTCTGTAGGACTCCTTCCCCCCTAGCCAAACGGACGCTGCTC GCCATCGCAACGCCGTCCCTTGATGCATCTCCAGAACACGGCTGCCTAGTTGTTCGATTACCACCAGAAGCAGGGGT TGAGACACCGATATCCCCTTGATAAACGTTGTGGCCTGACGGTTGAGGTAGCCCCACAGGATGTCGGCCTCATGGAC CAGAGTCCCAAGTCTAGAATTTCCAAACAGGGTAACTCCACAGAGTGCCCAGATGGTGTGCTCCTGATCCACCGCCA TGGTTGTGTCCATTCACAGCCAGTCCCTGTCAGTATGCGAAGGATCCCCAGAAGCGGAAACTGAAGGATACTACTGG AAGCTCACCAGAACAATTTAGTGCCTGTCAACTAATTGTAACATCACGATTCGCTGCATGTGTTGCAATGCAACCCA ATTGAGCTGCTCTGCTGAATTCAACTCTTTACAATCGCCCCCTAGATGCGCCATGGAATGCACCTTAACCAGTTCAG CGCATGCCGTAGTTGAGACACCCTCCCCCACCTAGCTATGGGGGCCTTAAATCTACATGTGTATAAAGTGTGCGTCT CATCGACACGGATGTGGAAGGCCAGATGGACTTTGGTCTGACAACGGCGATTGACCGATCAATAGACATCTTCCGCA AACATGGAGGGTCCATCTCGTGTGTACCTTTTTGGAGACCAGACCAGCGACATCGAAGCTGGCCTGCGCCGTCTGCT CCAAGCGAAGAATAGTACCATTgtttaaacgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggttgtttaaacTGATGCCGCTCGCTACCTAATCCTTGAAGAGGGCGAACAGGTTGACCGATTGCTTCTTCTTGACTC GCCCTTCCCCATTGGCTTAGAGAAGTTGCCCACTCGGCTGTACGGCTTCATCAACTCAATGGGTCTCTTTGGTGAAG GCAACAAGGCTCCCCCGGCCTGGTTGCTCCCTCATTTCCTGGCCTTCATTGATTCCCTCGATACCTACAAGGCCGTC CCCCTCCCCTTTGACGATCCGAAGTGGGCCAAGAAGATGCCAAAGACATTCATGGTCTGGGCCAAGGACGGTATCTG CAGCAAGCCGGATGACCCGTGGCCCGAGCCGGACCCGGACGGCAAGCCGGACACGAGAGAGATGGTCTGGCTCCTCA AGAACCGGACCGACATGGGACCCAACAAGTGGGACACACTCGTCGGGCCCCAAAACGTCGGTGGAATCACTGTGATA GAGGGTGCGAATCATTTCACCATGACTTTGGGACCCAAGGCTAAAGAATTGGGCTCGTTCATTGGCAACGCCATGGC CAATTAAATTGTTATGCATTACGCCTTCCTCCAAGACTCGCGCTAGGACTGACAACACTACCATCCTATTGATGGAA CTCGCATAATAATCCACTAATGCTGGTGTTGTACCCCCTCAGGATTCAAGCACACTATTGTTGTGATTGCAATCGGC GAATTCCGTGGTGCTAATGGTCTACCTGGTTCCGGGTTCCTTGGAGTGAAGTGATGATGTTGATGAAAAAGACGAAC GATGTGATATACGAACCCCTCATGTCATTTGCTACATCCTTATCGGAGTTAGTTGATATGTCTCATCTACGTACCTA TGTTACTTGATTTATGATAGAATGCCAATACGAAAAAAAAGTCATATCAAATCAGTGCCCATGCCCAATTTGTGATA AGAATAGAGCACTCGTAGAATGGAAAATTGGGAGTCTCACATCTCCCATAACCTAGACTAACCGATAATACAAAACC TCTGCAAGTTTAGATGGTGACTAGAACCCCAACAACACTGGCACCGCAATCGGCGATAGGAAACAAAGAAACGTCCC GATGAATGCAAGGTAATCCATCTATTCCATCTCATATCGAGATGAATGCATAGCATGCACAGTATGCATGTGAGCAT GGATAGGAGACTAAAGAGGATGGTGGGAACGAATTTGTTTGTATGTTTCATTGGGTTGATTGGTTATCTGGTTGAAC TTCTAATGCACTGTAACCCAATCTAGTCACTCCTGGGAGGGACAGAACAAGACCAGGACTTAGCAGCGCGTAAATAC TGAGTAAGAAGATGCATATGGTGGACATTCACTCCGCACCTACATACATGATGGGAAGGGAGGAAGAGAGACAAGAT GAAGCTGATTTAGAGGATTATTCGGTAATCGGGATGAGATCGGCGAGGTATATGCACTGTATGCTGCGGTGGTCGGG TAAGTTTGATGGAGCAGGTAGATAGGGAGGCGGGGGGAGGTGATAGATAGGATAGATAGGCAGGGAGTAGTATGAAC AGGGAAAGAGAACCTGATGCAGAGCCGAAATAGGTATGTATGCATGAATGTATGCAAGGAGGCGAATACGAGGGAGG CCGAACGTCGATTGATGAGTGGCGTCTGGGTCGGTTGGTGGTTGGCTGATGGACTGACGGATCGGTCGAATTGGAAG GAAGAAGTTGGTAGGTAGTGAGAGGTAGGGTGGTATCGATGTATCGAACTAAAGAGGCATTTCGGAGCTGAATCTGA GCGCACTACCGCGACCTGCAAGCGATGAACCATTGTTGATGCCAGGACTCGTGGGCCGGCTATTACCTGCAGTCCAT TTGGGGCTTCGCGGCTGTGTGCTGGTTGAGCGAGTGGACGGGCGATTTTTCCGAATTTCCCGAAGTTCTTCTTCCTT CCGGCGGAGCAGATCTTCGCGGGACGTGAGGGTTGCTTCGAGTTCGAGAACCCGCGCGAGATGGCGGGCTTCGTCGT TCTTCGCGTTGAGTTCGCGCAGATGGGTGGCGTCTCCTTCGACCTTCCGTTTCAGGGTTTCGTTCTCGCTGCGCAGT TGGCGAAGCTCGTTGCCTGATTGTGCGGCCACTGTCGAGGCGGTCTGGTACTGTTCGCGCGTGTATTCCGCTTGTCG GGCTTCGTACTCGGCTTTGCGTTCTAGCGATGCATTGTCTTTAGTCAGACGCCGAATGTCTTCCCTTGCTGATTCGA GTTCGGCTGCGCTGCCCCCGCCTGCTTTGAGGGATGCGCGGGCCTCTTCGAGTTCGTGTCGGAGCTGGGTCCGTTCG TCCTTCAATTTCATGAGCTCTTCCTTCTGCTTTTCGACTCGCTGGTCGGATGTGGTCTTAGCTTGGGTGAGACGGTC ATGCTCCCGTCGGAGTTTGTGGAAGTCTTTGGTTCTTGTCTCGTAACGGTGCTGCAGCTTTTCCAGCACGTTCTCTC TTTCCTGAAGACGGGCTTGGGCTCC
注:下划线表示albA的5’侧翼区域和3’侧翼区域。黑色小写字母表示PtrpC-hph-TtrpC表达盒。
7.2长同源臂的大片段DNA敲除打靶片段的构建
长同源臂的大片段DNA敲除打靶片段LHAd-albA-hph的构建采用ClonExpressTMMultiS多片段一步克隆试剂盒(Vazyme,C113)来完成。引物序列设计如表7所示。具体操作如下:
(1)各打靶片段的PCR扩增
首先,以albA-up-Fm与albA-up-Rm为引物,以黑曲霉基因组为模板进行PCR扩增,获得打靶片段的上游同源臂albA-up;以albA-down-Fm与albA-down-Rm为引物,以黑曲霉基因组为模板进行PCR扩增,获得打靶片段的下游同源臂albA-down;以hph-Fm与hph-Rm为引物,以pSilent-1为模板进行PCR扩增,获得打靶片段的筛选标记hph的表达盒。PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行后续操作,albA-up大小为2640bp,albA-down大小为2478bp,hph的表达盒大小为1914bp。
表7.LHAd-albA-hph的构建所用引物
(2)载体pEASY-Blunt的反向PCR
以pEASY-Blunt-F与pEASY-Blunt-R为引物,以p5S-sgRNA为模板进行该载体的反向PCR扩增,获得pEASY-Blunt的线性化载体骨架。具体引物序列如表5所示。PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行后续操作,pEASY-Blunt的线性化载体骨架大小为3830bp。
(3)各DNA片段与pEASY-Blunt线性化载体的重组与转化
将纯化后的各PCR产物albA-up、hph的表达盒与albA-down共同与pEASY-Blunt线性化载体采用ClonExpressTM MultiS多片段一步克隆试剂盒进行一步重组反应。反应条件为37℃反应30min。然后将连接体系热激转化大肠杆菌DH5α感受态细胞,涂LB/Amp平板。
(4)打靶载体pLHAd-albA-hph的菌落PCR与测序验证
挑取单克隆分别以pEASY-Blunt的载体引物如M13F与M13R为引物进行菌落PCR验证,目的条带大小为7097bp。挑取阳性单克隆并在LB/Amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建含有长同源臂针对albA的打靶质粒,其序列均与理论序列相一致。
7.3长同源臂介导的基因精准编辑效率的检测
将长同源臂albA大片段DNA敲除打靶片段LHAd-albA-hph为供体DNA与Cas9表达质粒以及两个sgRNA-albA一起共转化黑曲霉kusA失活菌株dkusA,从而测试在kusA失活的遗传背景下的同源重组效率。原生质体的转化方法如实施例2.5所述,分别制备kusA失活菌株dkusA的原生质体,在转化体系中分别加入100μL原生质体悬液、10μg pCas9,5μg sgRNA-albA-192,5μg sgRNA-albA-196片段与5μgLHAd-albA-hph片段,其余操作均相同。
在kusA失活的菌株中,该新型CRISPR/Cas9系统在长同源臂的打靶片段下介导的同源重组下的基因组编辑效率可高达100%,说明kusA的存在还是会影响同源重组的效率,kusA基因失活后,基因组编辑的效率可有5倍的提升,如图10所示。这表明该新型CRISPR/Cas9系统结合kusA基因失活底盘菌株可显著提高基因打靶的准确性,为基因组上的原位定点突变、DNA片段的插入、敲除与替换等基因组高效编辑奠定基础。
实施例8.kusA失活底盘菌株中超短同源臂介导下的基因组编辑
在新型CRISPR/Cas9系统的基础上,为简化基因精确编辑的敲除供体DNA片段构建工作,本发明实现了超短同源臂介导的基因组精准定位编辑。为进一步的提高同源重组的效率,在kusA失活的底盘菌株中实现了特定位点的大片段DNA的精确敲除。下面具体以同源臂的长度设计为40bp,结合kusA失活的底盘菌株,利用新型CRISPR/Cas9系统在albA基因特定位点的大片段DNA敲除为例,进行论述。
8.1大片段DNA敲除供体DNA片段的设计与构建
超短同源臂albA大片段DNA敲除供体DNA片段MHAd-albA-hph序列中,上下游同源臂位置分别紧邻靶序列albA-192的上游与靶序列albA-196下游,具体设计与序列位置如图11A所示。
MHAd-albA-hph序列如下所示(SEQ ID NO:49):
ATCATTGGTATGTCTGGAAGATTTCCTGACTCGGATGGTgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggttTCGCTACCTAATCCTTGAAGAGGGCGAACAGGTTGACCGATTGCTTCTTCTTGACTCGCCCTT
注:下划线表示albA的5’侧翼区域和3’侧翼区域;黑色小写字母表示PtrpC-hph-TtrpC表达盒。
MHAd-albA-hph的构建采用一步PCR的方法来完成。引物序列设计如表8所示。直接以MHAd-albA-F与MHAd-albA-R为引物以pSilent-1为模板进行PCR扩增,来获得供体DNA片段MHAd-albA-hph。PCR反应体系为采用TransGene的FastPfu DNA聚合酶的50μL反应体系,Touchdown PCR反应条件为本领域常规反应条件。PCR产物进行PCR产物纯化后进行PEG-介导的原生质体转化,大小为1978bp。
表8.MHAd-albA-hph的构建所用引物
8.2超短同源臂介导的基因精准编辑效率的检测
将超短同源臂albA大片段DNA敲除供体DNA片段MHAd-albA-hph为供体DNA与Cas9表达质粒以及两个向导RNA-albA一起共转化kusA失活菌株dkusA,从而测试在kusA失活的遗传背景下的同源重组效率,具体同源重组过程如图11A所示。原生质体的转化方法如实施例2.5所述,分别制备野生型AB4.1与kusA失活菌株dkusA的原生质体,在转化体系中分别加入100μL原生质体悬液、10μg pCas9,5μg向导RNA-albA-192,5μg向导RNA-albA-196片段与5μg MHAd-albA-hph片段,其余操作均相同。
在kusA失活的菌株中,CRISPR/Cas9系统介导的同源重组可达到100%,非常准确地定位在所设计的同源臂处,未出现其他片段的插入或基因片段缺失的现象,如图11B所示。NHEJ失活后,即使采用短同源臂,基因敲除的效率可达100%。这该新型CRISPR/Cas9系统结合kusA基因失活底盘菌株即使在超短同源臂的介导下也可显著提高基因打靶的准确性,为基因组上的原位定点突变、DNA片段的插入、敲除与替换等基因组高效快速编辑奠定基础。
实施例9.包含5S rRNA不同长度的上游序列的向导RNA表达盒对CRISPR/Cas9系统基因组编辑效率的影响
为进一步鉴定5S rRNA启动子的核心元件,本发明人首先将黑曲霉的5S rRNA(An12e05410)与人类与酵母的5S rRNA进行序列比对。比对结果发现,在黑曲霉5S rRNA的基因内部分别包括A-box(+51-+62)、C-box(+82-+92)与中间元件IE(+68-+73),这些元件为TFIIIA与TFIIIC的结合关键位点,是介导RNA聚合酶III启动转录的关键位点。但在黑曲霉5S rRNA基因的上游,与人类5S rRNA不同,不存在人类5S rRNA上游中的D-box元件,而是与III类启动子的相似,分别具有远端序列元件(Distal sequence element,DSE;-96--88)、近端序列元件(proximal sequence element,PSE;-65--48)与TATA-like box(-33--22)(图12A)。为检测这些可能的调控元件对CRISPR/Cas9系统的基因组编辑效率的影响,本发明设计了一系列包括不同元件的5S rRNA-HDV-sgRNA表达盒(Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1,图12A)。
这一系列包括不同元件的5S rRNA-HDV-sgRNA表达盒(Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1)的构建采用一步PCR的方法来完成。引物序列设计如表9所示。分别采用5S_Fm1-338、5S_Fm2-160、5S_Fm3-106、5S_Fm4-65、5S_Fm5-35与5S_Fm6+1为上游引物,以sgRNA_R为下游引物,以p5S-HDV-sgRNA-albA-188为模板进行PCR扩增,来分别获得不同的5S rRNA-HDV-sgRNA表达盒Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1,DNA大小分别为661、502、429、388、358与327bp(图12B)。PCR产物进行PCR产物纯化后进行PEG-介导的原生质体转化。
表9.一系列不同上游序列5S rRNA-HDV-sgRNA表达盒的构建所用引物
将这一系列包括不同元件的5S rRNA-HDV-sgRNA表达盒(Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1)的PCR纯化产物与Cas9表达质粒共转化黑曲霉野生型AB4.1。原生质体的转化方法如实施例2.5所述,分别制备野生型AB4.1的原生质体,在转化体系中分别加入100μL原生质体悬液、5μg pCas9,5μg一系列包括不同元件的5S rRNA-HDV-sgRNA表达盒(Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1),其余操作均相同。
在野生型AB4.1菌株中,一系列包括不同元件的5S rRNA-HDV-sgRNA表达盒(Δ5’-338,Δ5’-160,Δ5’-106,Δ5’-65,Δ5’-35与Δ5’+1)均可实现对albA基因的高效失活,其基因组编辑效率分别为100±0.6%,93.33±5.3%,100±0.4%,95.45±4.2%,93.75±2.2%,100±0.5%(图12C)。这表明虽然在黑曲霉5S rRNA的上游存在如远端序列元件(Distal sequence element,DSE;-96--88)、近端序列元件(proximal sequence element,PSE;-65--48)与TATA-like box(-33--22)等可能的转录起始调控元件,但是这些元件对5SrRNA的转录起始效率的影响不大。而在5S rRNA基因内部的A-box(+51-+62)、C-box(+82-+92)与中间元件IE(+68-+73)等转录因子结合位点则足以起始5S rRNA以及下游HDV与sgRNA的转录,因此只以5S rRNA基因为启动子的表达盒Δ5’+1也可高效介导的基因组编辑。
实施例10.不同物种的5S rRNA基因的发现
本实施例用于说明,如何在任意真核物种中发现其5SRNA,以便用于构建本发明的CRISPR/Cas系统。
首先,在5S rRNA数据库(http://combio.pl/rrna/)存在810个真核物种2861条5SrRNA的基因序列。这些序列可用于按照本发明的新型向导RNA表达盒构建策略,在不同真核物种中快速建立CRISPR/Cas系统。
其次,从5S rRNA数据库中收集一系列5S rRNA基因序列,分别来源于酿酒酵母、解脂耶氏酵母、乳酸克鲁维酵母、白色念珠菌、近光滑念珠菌与裂殖酵母菌等酵母;黑曲霉、黄曲霉、构巢曲霉、产黄青霉、灰黄青霉、哈次木霉、绿色木霉、粗糙脉孢霉、稻瘟霉以及玉米黑粉霉等丝状真菌;拟南芥、烟草、水稻、野生稻、小麦、玉米、大豆、油菜、棉花、甘蓝与甜菜等植物;果蝇、家蚕与秀丽线虫等昆虫;斑马鱼与鲤鱼等鱼类;北欧爪蟾与非洲爪蟾等两栖类;鸡与鸿雁等禽类;人、小鼠、大鼠、家兔、牛、狗、猫与猪等哺乳动物。采用MAGE进行了进化树分析以及利用5S rRNA数据库的结构比对工具进行了多序列间保守结构域的分析。如图13A和B所示,不同物种来源的5S rRNA基因序列在同一门中的保守性较强,即在真菌、植物与动物等大类中在序列与结构上都非常保守。由此可推断,即使在5S rRNA基因序列未知的物种中,通过与近缘已公布的5S rRNA基因的序列比对,也可非常方便地鉴定出其5S rRNA基因序列,用于按照本发明的新型向导RNA表达盒构建策略,在该物种中快速建立CRISPR/Cas系统。
另外,鉴于5S rRNA基因的保守性,也可直接采用已公布的近缘5S rRNA基因作为启动子来起始向导RNA的表达,建立CRISPR/Cas系统。
因此,按照本发明中的新型向导RNA表达盒构建策略,可以在不同物种中快速构建适用于该物种的CRISPR/Cas系统。
实施例11.利用新型CRISPR/dCas9系统对绿色荧光蛋白基因进行基因表达调控
本发明中以5S rRNA为启动子的向导RNA表达盒除用于CRISPR/Cas9系统进行基因组高效编辑外,也可用于CRISPR/dCas9系统实现特定基因的表达调控。在本实施例中,展示CRISPR/dCas9系统对增强型绿色荧光蛋白基因sgfp进行基因表达调控。
针对sgfp基因设计了其靶序列sgfp-130,的双链以引物的形式进行合成,具体引物信息如表10所示。p5S-sgRNA的BbsI酶切与去磷酸化、靶序列的引物溶解、双链退火与磷酸化以及连接转化等分子实验操作如实施例1.4所述。
表10.CRISPR/dCas9系统构建的相关引物
注:加粗碱基为突变为丙氨酸的位点。
dCas9(D10AH840A)表达质粒的构建通过Site-Directed Mutagenesis Kit(NEB)定点突变试剂盒,分别采用引物Cas9D10A-F与Cas9D10A-R对pCas9进行反向扩增,获得D10A单突变的质粒pnCas9-D10A。然后再采用引物Cas9H840A-F与Cas9H840A-R对pnCas9-D10A进行反向扩增,获得D10AH840A双突变的质粒pdCas9。
将dCas9(D10AH840A)表达质粒与向导RNA-sgfp-130共转化黑曲霉AB4.1-SGFP菌株。原生质体的转化方法如实施例1.5所述,在转化体系中分别加入100μL原生质体悬液、5μg pdCas9,5μg向导RNA-sgfp-130表达盒,其余操作均相同。
随机选取10个转化子,将其孢子悬液在微孔板中培养12h后,采用SpectramaxM2型多功能酶标仪(美国)在480nm下检测各转化子的荧光强度,以表征各转化子中的绿色荧光蛋白表达强度。结果表明,本发明的CRISPR/dCas9系统对AB4.1-SGFP菌株中对于sgfp的表达水平实现了不同程度的抑制,其基因下调76.5±3.5%以上。这表明该新型向导RNA的表达盒在CRISPR/dCas9系统中高效发挥作用。
序列表
<110> 中国科学院天津工业生物技术研究所
<120> 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用
<130> P2017-0161
<160> 64
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> albA基因的靶序列188
<400> 1
agtgggatct caagaactac 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> albA基因的靶序列192
<400> 2
atttcctgac tcggatggta 20
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> albA基因的靶序列194
<400> 3
ctggagatga tgggaataac 20
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> albA基因的靶序列196
<400> 4
tcgctaccta atccttgaag 20
<210> 5
<211> 4245
<212> DNA
<213> Artificial Sequence
<220>
<223> 带有核定位信号的anCas9的编码序列
<400> 5
atgccaaaga agaagcggaa ggtcatggat aagaagtact ccatcggcct cgacatcggc 60
accaactccg tcggctgggc cgtcatcacc gatgagtaca aggtcccttc caagaagttc 120
aaggtcctcg gcaacaccga tcgccattcc atcaagaaga acctgatcgg cgccctcctg 180
ttcgattccg gcgaaaccgc cgaggccacc cgccttaaac gcaccgcccg tcgccgctac 240
acccgccgca agaaccgcat ctgctacctc caagaaatct tctccaacga gatggccaag 300
gtcgatgata gcttcttcca ccgcctcgaa gagtccttcc tggtcgaaga ggataagaag 360
cacgagcgcc atcctatctt cggcaacatc gtcgatgagg tcgcctacca tgagaagtac 420
cctaccatct accatctccg caagaagctc gtcgattcca ccgataaggc cgatctccgc 480
ctcatctacc tcgccctcgc ccatatgatc aagttccgcg gccatttcct catcgagggc 540
gatctcaacc ctgataactc cgatgtcgat aagctgttca tccagctcgt ccagacctac 600
aaccagctgt tcgaggaaaa ccctatcaac gcctccggcg tcgatgccaa ggccatcctc 660
tccgctcgcc tctccaagtc tcgccgcctt gagaacctta tcgcccagct ccctggcgag 720
aagaagaacg gcctcttcgg caacctgatc gccctctccc tcggcctcac ccctaacttc 780
aagtccaact tcgatctcgc cgaggatgcc aagctccagc tctccaagga tacctacgat 840
gatgatctcg ataacctcct cgcccagatc ggcgatcagt acgccgatct gttcctcgcc 900
gccaagaacc tctccgatgc catcctcctc tccgacatcc tccgcgtcaa caccgagatc 960
accaaggccc ctctgtccgc ctccatgatc aagcgctacg atgagcatca tcaggacctc 1020
accctgctca aggccctcgt ccgccagcag ctccctgaga agtacaaaga gattttcttc 1080
gatcagtcca agaacggcta cgccggctac atcgatggcg gcgcttccca agaagagttc 1140
tacaagttca tcaagcctat ccttgagaag atggatggca ccgaggaact cctcgtcaag 1200
ctcaaccgcg aggacctcct ccgcaagcag cgcaccttcg ataacggctc catccctcat 1260
caaatccatc tcggcgagct gcatgccatc ttgcgccgcc aagaggattt ctacccattc 1320
ctcaaggata accgcgagaa gatcgaaaag attctcacct tccgcatccc ttactacgtc 1380
ggccctctcg ctcgcggcaa ctcccgcttc gcctggatga cccgcaagtc cgaggaaacc 1440
atcacccctt ggaacttcga ggaagtcgtc gataagggcg cctccgccca gtccttcatc 1500
gagcgcatga ccaacttcga taagaacctc cctaacgaga aggtcctccc taagcactcc 1560
ctgctctacg agtacttcac cgtctacaac gagctgacca aggtcaagta cgtcaccgag 1620
ggtatgcgca agcctgcctt cctgtccggc gagcagaaga aggccatcgt cgatctgctg 1680
ttcaagacca accgcaaggt caccgtcaag cagctcaaag aggattactt caagaaaatc 1740
gagtgcttcg attccgtcga gatcagcggc gtcgaggacc gcttcaacgc ctccctcgga 1800
acctaccatg atctcctcaa gattatcaag gataaggatt tcctcgacaa cgaggaaaac 1860
gaggacatcc ttgaggacat cgtcctcacc ctcaccctct tcgaggaccg cgaaatgatc 1920
gaggaacgcc tcaagaccta cgcccatctc ttcgatgata aggtcatgaa gcagctcaag 1980
cgccgtcgct acaccggctg gggtcgcctc tcccgcaagc tcatcaacgg catccgcgat 2040
aagcagtccg gcaagactat cctcgatttc ctcaagtccg atggcttcgc caaccgcaac 2100
ttcatgcagc tcatccatga tgattccctc accttcaaag aggacatcca gaaggcccag 2160
gtcagcggcc agggcgattc cctccatgag catatcgcca acctcgccgg ctcccctgcc 2220
atcaagaagg gcatcctcca gaccgtcaag gtcgtcgatg agctggtcaa ggtcatgggc 2280
cgccataagc ctgagaacat cgtcatcgag atggcccgcg agaaccagac cacccagaag 2340
ggccagaaga actcccgcga gcgcatgaag cgcatcgagg aaggcatcaa agagctgggc 2400
agccaaatcc tcaaagagca tcctgtcgag aacacccagc tccagaacga gaagctctac 2460
ctctactacc tccagaacgg ccgcgatatg tacgtcgatc aagagctgga catcaaccgc 2520
ctctccgatt acgatgtcga tcatatcgtc cctcagtcct tcctgaagga tgattccatc 2580
gataacaagg tcctcacccg ctccgataag aaccgcggca agtccgataa cgtcccttcc 2640
gaagaggtcg tcaagaagat gaagaactac tggcgccagc tcctcaacgc caagctcatc 2700
acccagcgca agttcgataa cctcaccaag gccgagcgcg gtggcctctc cgagctggat 2760
aaggccggct tcatcaagcg ccagctcgtc gaaacccgcc agatcaccaa gcacgtcgcc 2820
caaatcctcg attcccgcat gaacaccaag tacgatgaga acgataagct catccgcgaa 2880
gtcaaggtca tcaccctcaa gtccaagctc gtcagcgatt tccgcaagga tttccagttc 2940
tacaaggtcc gcgagatcaa caactaccat catgcccatg atgcctacct caacgccgtc 3000
gtcggcaccg ccctcatcaa gaagtacccc aagctcgaat ccgagttcgt ctacggtgat 3060
tacaaggtct acgatgtccg caagatgatc gccaagtccg agcaagagat cggcaaggct 3120
accgccaagt acttcttcta ctccaacatc atgaatttct tcaagaccga aatcaccctc 3180
gccaacggcg aaatccgcaa gcgccctctc atcgagacta acggcgagac tggcgagatc 3240
gtctgggata agggccgcga tttcgccacc gtccgcaagg tcctctccat gcctcaggtc 3300
aacatcgtca agaaaaccga ggtccagacc ggcggcttct ccaaagagtc catcctcccc 3360
aagcgcaact ccgataagct gatcgcccgc aagaaggatt gggaccctaa gaagtacggc 3420
ggcttcgatt cccctaccgt cgcctactcc gtcctcgtcg tcgccaaggt cgagaagggc 3480
aagtccaaga agctcaagtc cgtcaaagag ctgctcggca tcactattat ggaacgctcc 3540
agcttcgaga agaaccctat cgatttcctt gaggccaagg gctacaaaga ggtcaagaag 3600
gacctcatca tcaagctccc caagtactcc ctgttcgagc ttgagaacgg ccgcaagcgc 3660
atgctcgcct ccgccggtga gcttcagaag ggcaacgagc tggccctgcc ttccaagtac 3720
gtcaacttcc tctacctcgc ctcccattac gagaagctca agggctcccc tgaggataac 3780
gagcagaagc agctgttcgt cgagcagcat aagcactacc tcgatgagat catcgagcag 3840
atcagcgagt tctccaagcg cgtcatcctc gccgatgcca acctcgataa ggtcctgtcc 3900
gcctacaaca agcaccgcga taagcctatc cgcgagcagg ccgagaacat catccatctc 3960
ttcaccctca ccaacctcgg tgcccctgcc gccttcaagt acttcgatac caccatcgat 4020
cgcaagcgct acacctccac caaagaggtc ctggacgcca ccctcatcca tcagtccatc 4080
accggcctct acgaaacccg catcgatctc tcccagctcg gcggcgacaa gcgccccgcc 4140
gccaccaaga aggccggcca ggctaagaag aagaagtga 4179
<210> 6
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> 5S rRNA-sgRNA序列
<400> 6
aaacacatac gaccacaggg tgtggaaaac agggcttccc gtccgctcag ccgtacttaa 60
gccacacgcc gggaggttag tagttgggtg ggtgaccacc agcgaatccc ttctgttgta 120
tgaaaggacg aaacaccggg tcttcgagaa gacctgtttt agagctagaa atagcaagtt 180
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttt 237
<210> 7
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 7
ggttggagat tccagactca g 21
<210> 8
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 8
cagaggccga tttcgttgtc ccatacaaca gaagggattc g 41
<210> 9
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 9
cgaatccctt ctgttgtatg ggacaacgaa atcggcctct g 41
<210> 10
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 10
cgaatccctt ctgttgtatg ctgatgagtc cgtgaggacg aaacgagtaa gctcgtccac 60
cgggtcttcg agaag 75
<210> 11
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 11
cgaatccctt ctgttgtatg aaaggacgaa acaccggg 38
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 12
cttgtgccac accatagtag 20
<210> 13
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 13
caccagtggg atctcaagaa ctac 24
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 14
aaacgtagtt cttgagatcc cact 24
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 15
caccatttcc tgactcggat ggta 24
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 16
aaactaccat ccgagtcagg aaat 24
<210> 17
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 17
caccctggag atgatgggaa taac 24
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 18
aaacgttatt cccatcatct ccag 24
<210> 19
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 19
cacctcgcta cctaatcctt gaag 24
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 20
aaaccttcaa ggattaggta gcga 24
<210> 21
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<223> 5S rRNA-HDV-sgRNA序列
<400> 21
acatacgacc acagggtgtg gaaaacaggg cttcccgtcc gctcagccgt acttaagcca 60
cacgccggga ggttagtagt tgggtgggtg accaccagcg aatcccttct gttgtatggg 120
acaacgaaat cggcctctgc aacctccacg tggtgttgtc tgggaacctg atcaaaacta 180
ccgagtttga tcaggccaat gcagagaaag gacgaaacac cgggtcttcg agaagacctg 240
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 300
gcaccgagtc ggtgcttttt t 321
<210> 22
<211> 265
<212> DNA
<213> Artificial Sequence
<220>
<223> 5S rRNA-HH-sgRNA序列
<220>
<221> misc_feature
<222> (119)..(124)
<223> n is a, c, g, or t
<400> 22
acatacgacc acagggtgtg gaaaacaggg cttcccgtcc gctcagccgt acttaagcca 60
cacgccggga ggttagtagt tgggtgggtg accaccagcg aatcccttct gttgtatgnn 120
nnnnctgatg agtccgtgag gacgaaacga gtaagctcgt ccaccgggtc ttcgagaaga 180
cctgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 240
agtggcaccg agtcggtgct ttttt 265
<210> 23
<211> 357
<212> DNA
<213> Artificial Sequence
<220>
<223> PhU6-sgRNA序列
<400> 23
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaaggacg aaacaccggg tcttcgagaa gacctgtttt agagctagaa atagcaagtt 300
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttt 357
<210> 24
<211> 644
<212> DNA
<213> Artificial Sequence
<220>
<223> PyU6-sgRNA序列
<400> 24
gatcgataat tctccataat agttctgtta tttataatct ccagcactaa taaatgctat 60
acgtatattt gtacacaata taatttcaga atttatattg ctaccatgac tgtctgagaa 120
ttgggggaat aacttgataa ttgttgggat tccattgttc gtaaacgcaa taatattagg 180
tatatagaag atactaaatg ttctctccga ggatatagga atgctcacaa tggaatcgat 240
atatttctac ataatagtat tgagattatt cctcttttag ttttatataa ttcattatcc 300
tattacatta tcaatccttg catttcagct tccattagac ttaatgactg tttctcaatt 360
tttatgtcat cttcctggac ctcatgtgat actataccag tagcatgaat actactgaat 420
cgatgatact ttagagtttc attgcaacag tttcaacaca gcctggcatg aacagtggta 480
aaagtatttc gtccactatt ttcggctact ataaataaat gtttttttcg caactatgtg 540
caccgggtct tcgagaagac ctgttttaga gctagaaata gcaagttaaa ataaggctag 600
tccgttatca acttgaaaaa gtggcaccga gtcggtgctt tttt 644
<210> 25
<211> 513
<212> DNA
<213> Artificial Sequence
<220>
<223> PanU6-sgRNA序列
<400> 25
cccaagcttg atcgataatt cgccatggcg gccgcgggaa ttcgattccc aagcttgatc 60
gataattctc catcctgctc agacctcacc accccggagc agccgcgtcg tagcaaccat 120
cagcttccat taagactaat gactgtttct caattcttta tgtcatcttt cctgaggacc 180
ggcctagagc ggaaacacat gtgcagatcc cttcatgtga tactatacca gtagcatgaa 240
tacctactgg gcattggcgg tttaatcgat gatactttag agtttcatgg caatcagcaa 300
cagtttcaac aaccgccggt ataaggcatg aacagtggtc aagtccgctg taaagtattt 360
cgtcctacta tctcggctac tataaataaa tgttttttcg atctatgtgc accgggtctt 420
cgagaagacc tgttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa 480
cttgaaaaag tggcaccgag tcggtgcttt ttt 513
<210> 26
<211> 1978
<212> DNA
<213> Artificial Sequence
<220>
<223> MHAi-albA-hph序列
<400> 26
cctccgcctc ccagcctaca agtgggatct caagaactac gacgttaact gatattgaag 60
gagcactttt tgggcttggc tggagctagt ggaggtcaac aatgaatgcc tattttggtt 120
tagtcgtcca ggcggtgagc acaaaatttg tgtcgtttga caagatggtt catttaggca 180
actggtcaga tcagccccac ttgtagcagt agcggcggcg ctcgaagtgt gactcttatt 240
agcagacagg aacgaggaca ttattatcat ctgctgcttg gtgcacgata acttggtgcg 300
tttgtcaagc aaggtaagtg aacgacccgg tcataccttc ttaagttcgc ccttcctccc 360
tttatttcag attcaatctg acttacctat tctacccaag catcgatatg aaaaagcctg 420
aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc gtctccgacc 480
tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta ggagggcgtg 540
gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt tatgtttatc 600
ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg gaattcagcg 660
agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa gacctgcctg 720
aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg atcgctgcgg 780
ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc ggtcaataca 840
ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac tggcaaactg 900
tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg atgctttggg 960
ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc aacaatgtcc 1020
tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg ttcggggatt 1080
cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt atggagcagc 1140
agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg ctccgggcgt 1200
atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc aatttcgatg 1260
atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc gggactgtcg 1320
ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt gtagaagtac 1380
tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa tagagtagat 1440
gccgaccgga tcgatccact taacgttact gaaatcatca aacagcttga cgaatctgga 1500
tataagatcg ttggtgtcga tgtcagctcc ggagttgaga caaatggtgt tcaggatctc 1560
gataagatac gttcatttgt ccaagcagca aagagtgcct tctagtgatt taatagctcc 1620
atgtcaacaa gaataaaacg cgtttcgggt ttacctcttc cagatacagc tcatctgcaa 1680
tgcattaatg cattggacct cgcaacccta gtacgccctt caggctccgg cgaagcagaa 1740
gaatagctta gcagagtcta ttttcatttt cgggagacga gatcaagcag atcaacggtc 1800
gtcaagagac ctacgagact gaggaatccg ctcttggctc cacgcgacta tatatttgtc 1860
tctaattgta ctttgacatg ctcctcttct ttactctgat agcttgacta tgaaaattcc 1920
gtcaccagcc cctgggttat tccctatacc aacaacttct gcctgagcaa gggcgctc 1978
<210> 27
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 27
cctccgcctc ccagcctaca agtgggatct caagaactac gacgttaact gatattgaag 60
gagc 64
<210> 28
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 28
gagcgccctt gctcaggcag aagttgttgg tatagggaat aacccagggg ctggtgacgg 60
<210> 29
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 29
ccgccgcaca cgaacatcga cctgcagggg ttggagattc cagactcag 49
<210> 30
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 30
ccagtgccaa gcttgcatgc ctgcaggaaa aaagcaccga ctcggtgcca 50
<210> 31
<211> 6722
<212> DNA
<213> Artificial Sequence
<220>
<223> LHAi-kusA-amdS序列
<400> 31
attcgcctct tccatgactt cgagatccag ctcatacagg gtctcaatgt ggtcgctggt 60
gaaggcgatc ggtacgagga caatgtcggt ctgtccacgc ttcacgtact cttggacggt 120
atcgcttgtc tgcgctccca gccaagccct tggtccgacc tgagactgcc agcagaggcg 180
gtaagggttg ctaaaattga gcctttgcat caccgcatgc actgttgccg caacctcggc 240
cgggtatgga tcacctaaag gagaagttgt cggttagcta ccgggagttg gtcaccaaga 300
cccttgagac tcacctctgt tcacaacact catgggcaaa ctgtgggccg agaacaagag 360
aaccactcca tttctcttat cttccggata ggttttgagt tgatcctcaa tgtttctcgc 420
aaacgcctcc acaaggccag ggtgcgtagg ccatctgtcg ataacgctcc actggatagc 480
tccggaagtg tccacgtttc cgtttgctcg cttgccctcc agccgattcc tccatttcca 540
cagctcattc agagagctac ccgtagtaga acaggaatac tgggggtatt gtgagaacgc 600
gaccgcacga ccgcccttcc cattgccaaa gccatcttcc agcaattgtg tgtacatttg 660
ttccgtcagc gggttggcgt aacggaaggc aacgtacggc ttgtgaggcg cagtctccgg 720
gttgatcttg tccagcagct tgcacatttc cttgcattgg tattccgacc attttcttat 780
gggtgagcct ccgccgatgt ccgcatactg cttttgaatc ttgggtgtgc gtcgtttcga 840
aataagaggc ccgaggtaat gctggaactt gccaagagga atcaaatcgc cgtcggcctt 900
gaatagaagt agaatgttag aaacgtagca accagaatga cagcttgcca tagtcggaga 960
cgtacaaaga gccggctgag gaaatcctct acttcgtctg tcgtcgaggg ccctcccatg 1020
ttcaggaaga ccatggctgt agggccctta gagcctgttg catcctgggt aaccggaggc 1080
actgttgttg ccagcccaca tctttgttct tgcttgtatc cgaacagggt gcgagaagcc 1140
ggtcgcagca attgccgggg cagggtaaac gggcggcgga gagccatgac aggtaattgt 1200
actgaattcg gttgacctag tcaatggagg taataagaaa agaccgttcg tatcgcgcaa 1260
gcagatgaac tattcacgcc gcattaaata ttcaaaagat agacgagtgg caagaacagg 1320
tagtgggtgt atacaacagc gcaaggcctt ctggaagctg aaaagtccag aacggcttga 1380
tgacggagca ccgagaccac gaccaactcc gactcccgac agccaatgac cggccagcta 1440
gcgtcatcaa ttaccgggcg gacatcacat gatgttcgtg tctccccgcg tctttctgcc 1500
caccggtttg atcgcgtccc tcgcgaccgg atccagtgac gatatagata gatctatctc 1560
cggctgcagg cagcagaggc caaacaggca gacacaacag ccccacttgt tcctggttac 1620
gattcaagtt gtcttaacct ttatacttcc ctctttcaat ttcgataata tcttgaatgc 1680
tttaaacgat tccacaacat tctactatgg cggacggcaa cccacatcgg gaagatgagg 1740
cggccgagga agaagaggag attgatgaga ctgtacgcaa atttacccat gaacttggac 1800
tggaactctg gaactgacaa taagatcaga gctacaaacc agtcaaagat gcggtcctct 1860
tcgcaatcga tgtcagcgat tccatgttga ttttgaatag ctcgcccgct ggagagcatc 1920
ctgaatgcaa gtaacaaccg tagaggctga cacggcaggt gttgctaggg agcgtcgtgt 1980
tctacaaggc cagacgtctt cgcggttgat atatatgtat gtttgactgc aggctgctca 2040
gcgacgacag tcaagttcgc cctcgctgct tgtgcaataa tcgcagtggg gaagccacac 2100
cgtgactccc atctttcagt aaagctctgt tggtgtttat cagcaataca cgtaatttaa 2160
actcgttagc atggggctga tagcttaatt accgtttacc agtgccgcgg ttctgcagct 2220
ttccttggcc cgtaaaattc ggcgaagcca gccaatcacc agctaggcac cagctaaacc 2280
ctataattag tctcttatca acaccatccg ctcccccggg atcaatgagg agaatgaggg 2340
ggatgcgggg ctaaagaagc ctacataacc ctcatgccaa ctcccagttt acactcgtcg 2400
agccaacatc ctgactataa gctaacacag aatgcctcaa tcctgggaag aactggccgc 2460
tgataagcgc gcccgcctcg caaaaaccat ccctgatgaa tggaaagtcc agacgctgcc 2520
tgcggaagac agcgttattg atttcccaaa gaaatcgggg atcctttcag aggccgaact 2580
gaagatcaca gaggcctccg ctgcagatct tgtgtccaag ctggcggccg gagagttgac 2640
ctcggtggaa gttacgctag cattctgtaa acgggcagca atcgcccagc agttagtagg 2700
gtcccctcta cctctcaggg agatgtaaca acgccacctt atgggactat caagctgacg 2760
ctggcttctg tgcagacaaa ctgcgcccac gagttcttcc ctgacgccgc tctcgcgcag 2820
gcaagggaac tcgatgaata ctacgcaaag cacaagagac ccgttggtcc actccatggc 2880
ctccccatct ctctcaaaga ccagcttcga gtcaaggtac accgttgccc ctaagtcgtt 2940
agatgtccct ttttgtcagc taacatatgc caccagggct acgaaacatc aatgggctac 3000
atctcatggc taaacaagta cgacgaaggg gactcggttc tgacaaccat gctccgcaaa 3060
gccggtgccg tcttctacgt caagacctct gtcccgcaga ccctgatggt ctgcgagaca 3120
gtcaacaaca tcatcgggcg caccgtcaac ccacgcaaca agaactggtc gtgcggcggc 3180
agttctggtg gtgagggtgc gatcgttggg attcgtggtg gcgtcatcgg tgtaggaacg 3240
gatatcggtg gctcgattcg agtgccggcc gcgttcaact tcctgtacgg tctaaggccg 3300
agtcatgggc ggctgccgta tgcaaagatg gcgaacagca tggagggtca ggagacggtg 3360
cacagcgttg tcgggccgat tacgcactct gttgagggtg agtccttcgc ctcttccttc 3420
ttttcctgct ctataccagg cctccactgt cctcctttct tgctttttat actatatacg 3480
agaccggcag tcactgatga agtatgttag acctccgcct cttcaccaaa tccgtcctcg 3540
gtcaggagcc atggaaatac gactccaagg tcatccccat gccctggcgc cagtccgagt 3600
cggacattat tgcctccaag atcaagaacg gcgggctcaa tatcggctac tacaacttcg 3660
acggcaatgt ccttccacac cctcctatcc tgcgcggcgt ggaaaccacc gtcgccgcac 3720
tcgccaaagc cggtcacacc gtgaccccgt ggacgccata caagcacgat ttcggccacg 3780
atctcatctc ccatatctac gcggctgacg gcagcgccga cgtaatgcgc gatatcagtg 3840
catccggcga gccggcgatt ccaaatatca aagacctact gaacccgaac atcaaagctg 3900
ttaacatgaa cgagctctgg gacacgcatc tccagaagtg gaattaccag atggagtacc 3960
ttgagaaatg gcgggaggct gaagaaaagg ccgggaagga actggacgcc atcatcgcgc 4020
cgattacgcc taccgctgcg gtacggcatg accagttccg gtactatggg tatgcctctg 4080
tgatcaacct gctggatttc acgagcgtgg ttgttccggt tacctttgcg gataagaaca 4140
tcgataagaa gaatgagagt ttcaaggcgg ttagtgagct tgatgccctc gtgcaggaag 4200
agtatgatcc ggaggcgtac catggggcac cggttgcagt gcaggttatc ggacggagac 4260
tcagtgaaga gaggacgttg gcgattgcag aggaagtggg gaagttgctg ggaaatgtgg 4320
tgactccata gctaataagt gtcagatagc aatttgcaca agaaatcaat accagcaact 4380
gtaaataagc gctgaagtga ccatgccatg ctacgaaaga gcagaaaaaa acctgccgta 4440
gaaccgaaga gatatgacac gcttccatct ctcaaaggaa gaatcccttc agggttgcgt 4500
ttccagtcta gcgcctcgcc cctcagcaga tcctaagaaa cacacccaag aatcacccac 4560
cacggcagcg ctcaaatgcg cctatcactt catgcaacaa cgaatcatat caaatccaca 4620
agacatgatg ggtgttttgc tgttcgggac ccaggcgtcc aagttctttg aagaagatga 4680
agacagtcgg ggagacctgt cctaccccaa ctgctacctc ttcactgatc tggatgttcc 4740
ttcggctcat gaggtcaaag aacttcgagc actggtagat gatgaaggag actcaaggga 4800
ggttctatct ccagcgaaag agcaggtctc tatggcaaac gtcctatttt gcgccaacca 4860
gatattcaca tccagagcgc caaatttcct ctcccggcgt ttgttcatca taaccgacaa 4920
tgacaacccc catggtgatg ataaaaccct gcggtcagcg gcgactgtac gtgctaagga 4980
tctttacgat cttggtgtca caattgagct gtttccgatc tcacgccctg agcatgagtt 5040
caagaacagc aagttctatg acgtaagcta tcatactcta tagcaaagtg gcaggggtcg 5100
atactcacta cagatacaaa ggatattatc tacaagtcat tgcccagcga tccagaggcg 5160
cctgcatatc tacaatctga ttcaaaagcg gcgactgcga ccggggacgg gatttcactc 5220
ctcaacacgc ttctgtccag tattaattcg agaacggttc cgcgtcgcac tcatttttcg 5280
aacatgcctt tagaacttgg cccagacttc agaatttcgg tatcgggcta tatactctta 5340
cgaaggcaag cgcccgctag aaactccttc atctggctga acggcgagaa gcctgtggtc 5400
gcgaaaggag tgacttccca ctccgcagat gatactggcc ggactgtcga gaaatgggag 5460
atcagaaagg catataagtt cggtggcgac caagtaacct tttcgcctga tgagcagaag 5520
gcgcttaggg atttcggtga gccagtaatc cgggttattg ggttcaagcc tatcactgcg 5580
cttccattct gggcaaacgt caagcaccca tattttatct atccatccga ggaagactat 5640
gtaggctcct cgcgagtatt ttccgcattg catcagactc ttttgcgttc caagaagatg 5700
gcactcgtct ggttcattgc acgcaagggt gctggccccg ttctcgccgc tatgatcgca 5760
ggcgaagaaa agcttgatga gaatggcgta caaaaatacc ctcctggcat gtggattctt 5820
cccctcccct tcgcagacga tatccggcag aaccccgaaa caacgttgaa tgtcgccccg 5880
gagtcattga ttgatcagat gcgcgtggtc gtccagcaac tgcagctgcc gaagggagtg 5940
tacgagcctc tcaaataccc caatccatgt aagtcactgc tgtcttgcat tgctcgtata 6000
cgatgaacga gaagttgaca gcccgtgatc agcccttcaa tggcattacc gcatcctaca 6060
agctctcgca ttagacgaag atctccctga aaaaccagaa gacaaaacca ttccgaaata 6120
ccgccaaatc gacaaggtaa aaccactaca cccaagaaac aaccctccac gcattcaacc 6180
tactgacaat tgcaccgcag cgcgccggtg actacgtatt atcctgggcc gacgaactcg 6240
aaaagcaata cgccaaaacc tcagcagcgg cccctcgccc aaccagcacc ctcgtgaaac 6300
gaggatcaaa agaccgagca agcgaaaccg aggactccaa g 6341
<210> 32
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 32
gattacgcca agctgccctt attcgcctct tccatgactt cgagatcc 48
<210> 33
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 33
ctctccagcg ggcgagctat tcaaaaggcg tcaacatgga atcgctgaca tc 52
<210> 34
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 34
ttttgaatag ctcgcccgct ggagag 26
<210> 35
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 35
ctagactgga aacgcaaccc tgaag 25
<210> 36
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 36
cttcagggtt gcgtttccag tctagggtac cctcgagtcg cccctcagca gatcctaaga 60
aac 63
<210> 37
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 37
ggcgaattga agctgccctt cttggagtcc tcggtttcgc ttgctc 46
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 38
aagggcagct tcaattcgcc c 21
<210> 39
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 39
aagggcagct tggcgtaatc atg 23
<210> 40
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 40
cacccgagca ctggtagatg atga 24
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 41
aaactcatca tctaccagtg ctcg 24
<210> 42
<211> 7032
<212> DNA
<213> Artificial Sequence
<220>
<223> LHAd-albA-hph序列
<400> 42
actgtagcag cggagtaaga tggaaggttg tcattccagc caggctcgag gatacacgtg 60
ccacccacaa gtttacgacc caacctggaa cacgctagtc tagtaaatca cctggcagtt 120
ttctcaaccg ggcgttagat tgcgcttgtc tacaattaat actgtacagc gaaatttgtc 180
ttctattgtg tgacatcaac taatagtcca ggtctcatga tgcttactgg cacaggtatc 240
cgaccaaaga agttcttcct tcggaagtat gggtggaagg gtacgcggtt cggaaaagtc 300
tctgcagcgt cgacaacaga accaccaagg ttcacgagag gctcacgcca agtaacctta 360
ttgagacccg tatccgggat ggctggtacc agatggcttg tgtgctactt cttattgaca 420
gtaagcgtct ttgtcgattg tgtttgctcg ctcctgcgta cggaggattg taagctgata 480
gtctcgtgga ccataacgtg acatgatatt ccaggaaatc agagagctga caaatacatc 540
tgaacctgct agataggcct acgttgtctt ctgtatcctt tgctgagaca tgtttgggat 600
tatcctccat tgttaagggt ttccgaagcc gagggatatg cactatattt atcggaccac 660
acatgatcct tgagcaaacc actgctccta tgactaagaa cgcttgataa acccactgcg 720
aggcttttcg ggagaggctt ggcaatgtct cactaccaga tcatagggat accgcctctt 780
ggttcatact tcctgcattg gcttcttctg caaacagccc attttcagct gtctagcctg 840
accatgctga ccgtaatgag ggataacaat aggcttgaaa gttgctgatg gtgtgtaaga 900
ttgactaacc tctaggaata cttatgaaaa tgccaactca gaacaaattt ggaccgcaat 960
ggcacgagtg gaacgcaggg tggcagcacg gcttatgaac cttatcaatg cgacgcctcg 1020
agaggggcct caaatacctg tctaggatca cacattctcg gaggttaaag ttctagtttg 1080
gttattcggg cgagttattg aaccttgaca tttgtgggac acatgtcaag catgacccgc 1140
cactcgaatg gaaggttcgg tggctgaagc aaatttgaga cgatcctgat tcaacacaaa 1200
cccctcgagc cctgccatca gagctgtccg agcacggtgt gcaagagctc tgccagttaa 1260
actactcagt actagccaaa tggtactcag catgttggtt atatattcga gcatcatgca 1320
gggtttcaaa ccaggggaag gagtgcagag tcgagtcgaa cctgcaggat actgaacaag 1380
ccgtgaacta aaacagttca tatccctagc aaggcaaatg aaccggccat gctcgagaac 1440
cgggtagata tggcaggaag aatgatccgt cggtcaggct gcttcgagca tgtcatgtca 1500
ccactactac tccaccgact acattccagc aacaataacc ttgtttctcc agacatcgtt 1560
cgctgactag tttgtccgag tttcggaagt tgaataagcc aacatacact tcgggggatc 1620
tcgttggtag aaaacgcaag gtacatgcag ggcagcaggg cacggatctt gactgcctgg 1680
tctttcggca tgcgtctttc tgcgtctttc ccaccgatat catcggcgaa gcgagaaatc 1740
cttcggcctg gcccgtggaa ttttgtgtct catgcctagg gaggaaagat gttaggggaa 1800
tcttcacccc agacttcttt gtcgtttgtc acgtgctcgc tgcaacctgc tgatcgtcgc 1860
caaatggggc ggcgacgact ttcctctgta ggactccttc ccccctagcc aaacggacgc 1920
tgctcgccat cgcaacgccg tcccttgatg catctccaga acacggctgc ctagttgttc 1980
gattaccacc agaagcaggg gttgagacac cgatatcccc ttgataaacg ttgtggcctg 2040
acggttgagg tagccccaca ggatgtcggc ctcatggacc agagtcccaa gtctagaatt 2100
tccaaacagg gtaactccac agagtgccca gatggtgtgc tcctgatcca ccgccatggt 2160
tgtgtccatt cacagccagt ccctgtcagt atgcgaagga tccccagaag cggaaactga 2220
aggatactac tggaagctca ccagaacaat ttagtgcctg tcaactaatt gtaacatcac 2280
gattcgctgc atgtgttgca atgcaaccca attgagctgc tctgctgaat tcaactcttt 2340
acaatcgccc cctagatgcg ccatggaatg caccttaacc agttcagcgc atgccgtagt 2400
tgagacaccc tcccccacct agctatgggg gccttaaatc tacatgtgta taaagtgtgc 2460
gtctcatcga cacggatgtg gaaggccaga tggactttgg tctgacaacg gcgattgacc 2520
gatcaataga catcttccgc aaacatggag ggtccatctc gtgtgtacct ttttggagac 2580
cagaccagcg acatcgaagc tggcctgcgc cgtctgctcc aagcgaagaa tagtaccatt 2640
gtttaaacga cgttaactga tattgaagga gcactttttg ggcttggctg gagctagtgg 2700
aggtcaacaa tgaatgccta ttttggttta gtcgtccagg cggtgagcac aaaatttgtg 2760
tcgtttgaca agatggttca tttaggcaac tggtcagatc agccccactt gtagcagtag 2820
cggcggcgct cgaagtgtga ctcttattag cagacaggaa cgaggacatt attatcatct 2880
gctgcttggt gcacgataac ttggtgcgtt tgtcaagcaa ggtaagtgaa cgacccggtc 2940
ataccttctt aagttcgccc ttcctccctt tatttcagat tcaatctgac ttacctattc 3000
tacccaagca tcgatatgaa aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg 3060
atcgaaaagt tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt 3120
gctttcagct tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat 3180
ggtttctaca aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg 3240
gaagtgcttg acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca 3300
cagggtgtca cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc 3360
gcggaggcca tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca 3420
ttcggaccgc aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct 3480
gatccccatg tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg 3540
caggctctcg atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg 3600
cacgcggatt tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt 3660
gactggagcg aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg 3720
aggccgtggt tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag 3780
cttgcaggat cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat 3840
cagagcttgg ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca 3900
atcgtccgat ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc 3960
gtctggaccg atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact 4020
cgtccgaggg caaaggaata gagtagatgc cgaccggatc gatccactta acgttactga 4080
aatcatcaaa cagcttgacg aatctggata taagatcgtt ggtgtcgatg tcagctccgg 4140
agttgagaca aatggtgttc aggatctcga taagatacgt tcatttgtcc aagcagcaaa 4200
gagtgccttc tagtgattta atagctccat gtcaacaaga ataaaacgcg tttcgggttt 4260
acctcttcca gatacagctc atctgcaatg cattaatgca ttggacctcg caaccctagt 4320
acgcccttca ggctccggcg aagcagaaga atagcttagc agagtctatt ttcattttcg 4380
ggagacgaga tcaagcagat caacggtcgt caagagacct acgagactga ggaatccgct 4440
cttggctcca cgcgactata tatttgtctc taattgtact ttgacatgct cctcttcttt 4500
actctgatag cttgactatg aaaattccgt caccagcccc tgggttgttt aaactgatgc 4560
cgctcgctac ctaatccttg aagagggcga acaggttgac cgattgcttc ttcttgactc 4620
gcccttcccc attggcttag agaagttgcc cactcggctg tacggcttca tcaactcaat 4680
gggtctcttt ggtgaaggca acaaggctcc cccggcctgg ttgctccctc atttcctggc 4740
cttcattgat tccctcgata cctacaaggc cgtccccctc ccctttgacg atccgaagtg 4800
ggccaagaag atgccaaaga cattcatggt ctgggccaag gacggtatct gcagcaagcc 4860
ggatgacccg tggcccgagc cggacccgga cggcaagccg gacacgagag agatggtctg 4920
gctcctcaag aaccggaccg acatgggacc caacaagtgg gacacactcg tcgggcccca 4980
aaacgtcggt ggaatcactg tgatagaggg tgcgaatcat ttcaccatga ctttgggacc 5040
caaggctaaa gaattgggct cgttcattgg caacgccatg gccaattaaa ttgttatgca 5100
ttacgccttc ctccaagact cgcgctagga ctgacaacac taccatccta ttgatggaac 5160
tcgcataata atccactaat gctggtgttg taccccctca ggattcaagc acactattgt 5220
tgtgattgca atcggcgaat tccgtggtgc taatggtcta cctggttccg ggttccttgg 5280
agtgaagtga tgatgttgat gaaaaagacg aacgatgtga tatacgaacc cctcatgtca 5340
tttgctacat ccttatcgga gttagttgat atgtctcatc tacgtaccta tgttacttga 5400
tttatgatag aatgccaata cgaaaaaaaa gtcatatcaa atcagtgccc atgcccaatt 5460
tgtgataaga atagagcact cgtagaatgg aaaattggga gtctcacatc tcccataacc 5520
tagactaacc gataatacaa aacctctgca agtttagatg gtgactagaa ccccaacaac 5580
actggcaccg caatcggcga taggaaacaa agaaacgtcc cgatgaatgc aaggtaatcc 5640
atctattcca tctcatatcg agatgaatgc atagcatgca cagtatgcat gtgagcatgg 5700
ataggagact aaagaggatg gtgggaacga atttgtttgt atgtttcatt gggttgattg 5760
gttatctggt tgaacttcta atgcactgta acccaatcta gtcactcctg ggagggacag 5820
aacaagacca ggacttagca gcgcgtaaat actgagtaag aagatgcata tggtggacat 5880
tcactccgca cctacataca tgatgggaag ggaggaagag agacaagatg aagctgattt 5940
agaggattat tcggtaatcg ggatgagatc ggcgaggtat atgcactgta tgctgcggtg 6000
gtcgggtaag tttgatggag caggtagata gggaggcggg gggaggtgat agataggata 6060
gataggcagg gagtagtatg aacagggaaa gagaacctga tgcagagccg aaataggtat 6120
gtatgcatga atgtatgcaa ggaggcgaat acgagggagg ccgaacgtcg attgatgagt 6180
ggcgtctggg tcggttggtg gttggctgat ggactgacgg atcggtcgaa ttggaaggaa 6240
gaagttggta ggtagtgaga ggtagggtgg tatcgatgta tcgaactaaa gaggcatttc 6300
ggagctgaat ctgagcgcac taccgcgacc tgcaagcgat gaaccattgt tgatgccagg 6360
actcgtgggc cggctattac ctgcagtcca tttggggctt cgcggctgtg tgctggttga 6420
gcgagtggac gggcgatttt tccgaatttc ccgaagttct tcttccttcc ggcggagcag 6480
atcttcgcgg gacgtgaggg ttgcttcgag ttcgagaacc cgcgcgagat ggcgggcttc 6540
gtcgttcttc gcgttgagtt cgcgcagatg ggtggcgtct ccttcgacct tccgtttcag 6600
ggtttcgttc tcgctgcgca gttggcgaag ctcgttgcct gattgtgcgg ccactgtcga 6660
ggcggtctgg tactgttcgc gcgtgtattc cgcttgtcgg gcttcgtact cggctttgcg 6720
ttctagcgat gcattgtctt tagtcagacg ccgaatgtct tcccttgctg attcgagttc 6780
ggctgcgctg cccccgcctg ctttgaggga tgcgcgggcc tcttcgagtt cgtgtcggag 6840
ctgggtccgt tcgtccttca atttcatgag ctcttccttc tgcttttcga ctcgctggtc 6900
ggatgtggtc ttagcttggg tgagacggtc atgctcccgt cggagtttgt ggaagtcttt 6960
ggttcttgtc tcgtaacggt gctgcagctt ttccagcacg ttctctcttt cctgaagacg 7020
ggcttgggct cc 7032
<210> 43
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 43
gattacgcca agctgccctt actgtagcag cggagtaaga tg 42
<210> 44
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 44
catcagttta aacaatggta ctattcttcg cttgg 35
<210> 45
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 45
gcgaagaata gtaccattgt ttaaacgacg ttaactgata ttgaaggagc 50
<210> 46
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 46
ttaggtagcg agcggcatca gtttaaacaa cccaggggct ggtgacgg 48
<210> 47
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 47
gtaccattgt ttaaactgat gccgctcgct acctaatc 38
<210> 48
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 48
ggcgaattga agctgccctt ggagcccaag cccgtcttc 39
<210> 49
<211> 2000
<212> DNA
<213> Artificial Sequence
<220>
<223> MHAd-albA-hph序列
<400> 49
atcattggta tgtctggaag atttcctgac tcggatggtg acgttaactg atattgaagg 60
agcacttttt gggcttggct ggagctagtg gaggtcaaca atgaatgcct attttggttt 120
agtcgtccag gcggtgagca caaaatttgt gtcgtttgac aagatggttc atttaggcaa 180
ctggtcagat cagccccact tgtagcagta gcggcggcgc tcgaagtgtg actcttatta 240
gcagacagga acgaggacat tattatcatc tgctgcttgg tgcacgataa cttggtgcgt 300
ttgtcaagca aggtaagtga acgacccggt cataccttct taagttcgcc cttcctccct 360
ttatttcaga ttcaatctga cttacctatt ctacccaagc atcgatatga aaaagcctga 420
actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct 480
gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg 540
atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt atgtttatcg 600
gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg aattcagcga 660
gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag acctgcctga 720
aaccgaactg cccgctgttc tgcagccggt cgcggaggcc atggatgcga tcgctgcggc 780
cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg gtcaatacac 840
tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact ggcaaactgt 900
gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga tgctttgggc 960
cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca acaatgtcct 1020
gacggacaat ggccgcataa cagcggtcat tgactggagc gaggcgatgt tcggggattc 1080
ccaatacgag gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta tggagcagca 1140
gacgcgctac ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc tccgggcgta 1200
tatgctccgc attggtcttg accaactcta tcagagcttg gttgacggca atttcgatga 1260
tgcagcttgg gcgcagggtc gatgcgacgc aatcgtccga tccggagccg ggactgtcgg 1320
gcgtacacaa atcgcccgca gaagcgcggc cgtctggacc gatggctgtg tagaagtact 1380
cgccgatagt ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat agagtagatg 1440
ccgaccggat cgatccactt aacgttactg aaatcatcaa acagcttgac gaatctggat 1500
ataagatcgt tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg 1560
ataagatacg ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca 1620
tgtcaacaag aataaaacgc gtttcgggtt tacctcttcc agatacagct catctgcaat 1680
gcattaatgc attggacctc gcaaccctag tacgcccttc aggctccggc gaagcagaag 1740
aatagcttag cagagtctat tttcattttc gggagacgag atcaagcaga tcaacggtcg 1800
tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat atatttgtct 1860
ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat gaaaattccg 1920
tcaccagccc ctgggtttcg ctacctaatc cttgaagagg gcgaacaggt tgaccgattg 1980
cttcttcttg actcgccctt 2000
<210> 50
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 50
atcattggta tgtctggaag atttcctgac tcggatggta gacgttaact gatattgaag 60
gagc 64
<210> 51
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 51
aagggcgagt caagaagaag caatcggtca acctgttcgc aacccagggg ctggtgacgg 60
<210> 52
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 52
ggttggagat tccagactca g 21
<210> 53
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 53
ggatttctca ccaccagata ag 22
<210> 54
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 54
gatagatcgt atttcaaatg atacc 25
<210> 55
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 55
ctctcctttg cctaattaga tatgtgg 27
<210> 56
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 56
gactctatat aatttgagtc aataaccgaa taaac 35
<210> 57
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 57
acatacgacc acagggtgtg g 21
<210> 58
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 58
aaaaaagcac cgactcggtg cca 23
<210> 59
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 59
caccttcaag tccgccatgc ccga 24
<210> 60
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 60
aaactcgggc atggcggact tgaa 24
<210> 61
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 61
catcggcctc gccatcggca ccaactcc 28
<210> 62
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 62
ggtgccgatg gcgaggccga tggagtac 28
<210> 63
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 63
cgatgtcgat gccatcgtcc ctcagtcc 28
<210> 64
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> 引物
<400> 64
gagggacgat ggcatcgaca tcgtaatc 28

Claims (14)

1.一种应用于CRISPR/Cas系统的向导RNA表达盒,其特征在于,所述向导RNA表达盒是由真核生物的RNA聚合酶III识别的type 1启动子来起始向导RNA的表达。
2.如权利要求1所述的向导RNA表达盒,其特征在于,所述由真核生物的RNA聚合酶III识别的type 1启动子具有真核生物的5S rRNA基因的序列。
3.如权利要求1或2所述的向导RNA的表达盒,其特征在于,所述向导RNA的表达盒从5’-3’具有以下结构:
A-B-C
其中,
A为真核生物的RNA聚合酶III识别的type 1启动子;
B为无或可自我切割的核酶;
C为向导RNA。
4.如权利要求3所述的向导RNA表达盒,其特征在于,所述可自我切割的核酶选自HH核酶(hammerhead,HH ribozyme)、HP核酶(hairpin HP ribozyme)、glmS核酶(Glucosamine6-phosphate synthase,glmS ribozyme)、VS核酶(Varkud satellite,VS ribozyme)、HDV核酶(hepatitis delta virus,HDV ribozyme)与类HDV核酶(Hepatitis delta virus-like,HDV-like ribozyme)等;更优选地,所述核酶是HDV核酶与HH核酶。
5.一种载体,所述载体包含权利要求1-4中任一项所述的表达盒。
6.一种CRISPR/Cas系统,其特征在于,所述CRISPR/Cas系统包含权利要求1-4中任一项所述的向导RNA表达盒。
7.如权利要求6所述的CRISPR/Cas系统,其特征在于,所述的CRISPR/Cas系统是CRISPR/Cas9系统、CRISPR/nCas9系统或CRISPR/dCas9系统;优选地,所述CRISPR/Cas系统是CRISPR/Cas9系统。
8.如权利要求7所述的CRISPR/Cas系统,其特征在于,所述的CRISPR/Cas9系统可利用15-3000bp的同源臂的供体DNA进行基因精准编辑;优选地,所述的CRISPR/Cas9系统可利用20-200bp的同源臂的供体DNA进行基因精准编辑。
9.一种基因组编辑方法,其特征在于,所述方法利用权利要求6-8中任一项所述的CRISPR/Cas系统进行基因组编辑。
10.如权利要求9所述的基因组编辑方法,其特征在于,所述方法可利用15-3000bp的同源臂的供体DNA进行基因组精准编辑;优选地,所述方法可利用20-200bp的同源臂的供体DNA进行基因组精准编辑。
11.如权利要求9或10所述的基因组编辑方法,其特征在于,该方法用于真核生物的基因组编辑和转录调控。
12.如权利要求9-11中任一项所述的基因组编辑方法,其特征在于,所述基因组编辑方法应用于NHEJ系统活性弱化的真核生物。
13.如权利要求12所述的基因组编辑方法,其特征在于,所述NHEJ系统活性弱化是通过kusA基因失活实现。
14.真核生物的RNA聚合酶III识别的type 1启动子在向导RNA介导的CRISPR/Cas系统中作为启动子起始向导RNA转录的应用。
CN201710380366.XA 2017-05-25 2017-05-25 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用 Active CN107164375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710380366.XA CN107164375B (zh) 2017-05-25 2017-05-25 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710380366.XA CN107164375B (zh) 2017-05-25 2017-05-25 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用

Publications (2)

Publication Number Publication Date
CN107164375A true CN107164375A (zh) 2017-09-15
CN107164375B CN107164375B (zh) 2020-12-29

Family

ID=59820694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710380366.XA Active CN107164375B (zh) 2017-05-25 2017-05-25 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用

Country Status (1)

Country Link
CN (1) CN107164375B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109337921A (zh) * 2018-09-03 2019-02-15 华南理工大学 一种构建酿酒酵母裂解工程菌的重组载体及其应用
CN110592073A (zh) * 2019-09-25 2019-12-20 江西科技师范大学 一种基于crispr技术定向遗传改造米曲霉基因的方法
CN111057654A (zh) * 2019-12-19 2020-04-24 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于巴戟天内生真菌A761的Cas9基因敲除载体及其构建方法和应用
CN112538496A (zh) * 2020-12-23 2021-03-23 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于露湿漆斑菌A553的CRISPR/Cas9载体及其构建方法和应用
CN112553238A (zh) * 2020-12-10 2021-03-26 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于拟盾壳霉FS482的CRISPR/Cas9载体及其构建方法和应用
CN114214330A (zh) * 2021-12-20 2022-03-22 杭州百凌生物科技有限公司 一种检测脊索瘤的质控品及其制备方法和应用
CN114774459A (zh) * 2022-05-31 2022-07-22 中国热带农业科学院环境与植物保护研究所 一种香蕉枯萎菌CRISPR/Cas9基因编辑载体、制备方法及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
WO2014194190A1 (en) * 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
WO2014194190A1 (en) * 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
NØDVIG CHRISTINA S.,等: "A CRISPR-Cas9 System for Genetic Engineering of Filamentous Fungi", 《PLOS ONE》 *
SCHWARTZ CORY M.,等: "Synthetic RNA Polymerase III Promoters Facilitate High-Efficiency CRISPR-Cas9-Mediated Genome Editing in Yarrowia lipolytica", 《ACS SYNTHETIC BIOLOGY》 *
ZHENG XIAOMEI等: "5S rRNA Promoter for Guide RNA Expression Enabled Highly Efficient CRISPR/Cas9 Genome Editing in Aspergillus niger", 《ACS SYNTHETIC BIOLOGY》 *
邵斯旻等: "基因组编辑技术中供体DNA类型及选择", 《中国生物化学与分子生物学报》 *
郑小梅等: "CRISPR-Cas9介导的基因组编辑技术的研究进展", 《生物技术进展》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109337921A (zh) * 2018-09-03 2019-02-15 华南理工大学 一种构建酿酒酵母裂解工程菌的重组载体及其应用
CN109337921B (zh) * 2018-09-03 2021-07-20 华南理工大学 一种构建酿酒酵母裂解工程菌的重组载体及其应用
CN110592073A (zh) * 2019-09-25 2019-12-20 江西科技师范大学 一种基于crispr技术定向遗传改造米曲霉基因的方法
CN111057654A (zh) * 2019-12-19 2020-04-24 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于巴戟天内生真菌A761的Cas9基因敲除载体及其构建方法和应用
CN111057654B (zh) * 2019-12-19 2022-06-10 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于巴戟天内生真菌A761的Cas9基因敲除载体及其构建方法和应用
CN112553238A (zh) * 2020-12-10 2021-03-26 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于拟盾壳霉FS482的CRISPR/Cas9载体及其构建方法和应用
CN112553238B (zh) * 2020-12-10 2022-06-07 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于拟盾壳霉FS482的CRISPR/Cas9载体及其构建方法和应用
CN112538496A (zh) * 2020-12-23 2021-03-23 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于露湿漆斑菌A553的CRISPR/Cas9载体及其构建方法和应用
CN114214330A (zh) * 2021-12-20 2022-03-22 杭州百凌生物科技有限公司 一种检测脊索瘤的质控品及其制备方法和应用
CN114774459A (zh) * 2022-05-31 2022-07-22 中国热带农业科学院环境与植物保护研究所 一种香蕉枯萎菌CRISPR/Cas9基因编辑载体、制备方法及应用
CN114774459B (zh) * 2022-05-31 2024-03-12 中国热带农业科学院环境与植物保护研究所 一种香蕉枯萎菌CRISPR/Cas9基因编辑载体、制备方法及应用

Also Published As

Publication number Publication date
CN107164375B (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN107164375A (zh) 一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用
Gupta et al. CRISPR-Cas9 system: A new-fangled dawn in gene editing
CN108642055B (zh) 能有效编辑猪miR-17-92基因簇的sgRNA
CN104293828B (zh) 植物基因组定点修饰方法
CN105112435B (zh) 植物多基因敲除载体的构建及应用
CN107027313A (zh) 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
CN104560742A (zh) 农杆菌介导茭白黑粉菌转化子菌株及其制备方法和应用
CN111902541A (zh) 增加细胞中感兴趣的核酸分子表达水平的方法
CN107779468A (zh) 水稻nrt1.1a基因及其编码蛋白在提高植物产量育种中的应用
CN113801891B (zh) 甜菜BvCENH3基因单倍体诱导系的构建方法与应用
CN113337502B (zh) 一种gRNA及其用途
US20210040505A1 (en) Method for increasing efficiency of homologous recombination-based gene editing in plant
CN112481309B (zh) Ago蛋白的用途及组合物和基因编辑方法
CN110066323B (zh) 微藻捕光蛋白NoHLR1基因及其应用
CN109136257A (zh) 植物花药花粉发育后期特异性表达启动子pOsLPS3的鉴定和应用
CN105814207A (zh) 玉米调节元件及其用途
CN105814208A (zh) 玉米调节元件及其用途
CN109504680B (zh) 盐胁迫诱导型启动子及其引物、表达载体和应用
CN103361348B (zh) 与水稻叶片宽度调控相关microRNA及其编码核酸分子与应用
CN106434692A (zh) 水稻OsPCF7基因在培育高分蘖水稻品种中的应用
CN117210490B (zh) 一种调控苹果属植物自花结实的pchr基因及其应用
CN108586593A (zh) 与水稻落粒性相关的蛋白及其编码基因与应用
CN116240209B (zh) 中国春小麦中受白粉菌强诱导的增强子及其应用
CN114891791B (zh) 特异性靶向犬Rosa26基因的sgRNA及其应用
EP3889267A1 (en) (be-)curtovirus replicon-mediated genome editing in plants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant