CN107090466B - 双sgRNA表达质粒及其文库的构建方法 - Google Patents

双sgRNA表达质粒及其文库的构建方法 Download PDF

Info

Publication number
CN107090466B
CN107090466B CN201710262042.6A CN201710262042A CN107090466B CN 107090466 B CN107090466 B CN 107090466B CN 201710262042 A CN201710262042 A CN 201710262042A CN 107090466 B CN107090466 B CN 107090466B
Authority
CN
China
Prior art keywords
restriction enzyme
type iis
iis restriction
cleavage
sticky end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710262042.6A
Other languages
English (en)
Other versions
CN107090466A (zh
Inventor
谢震
马大程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hesheng Gene Science And Technology Co Ltd
Tsinghua University
Original Assignee
Beijing Hesheng Gene Science And Technology Co Ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hesheng Gene Science And Technology Co Ltd, Tsinghua University filed Critical Beijing Hesheng Gene Science And Technology Co Ltd
Priority to CN201710262042.6A priority Critical patent/CN107090466B/zh
Publication of CN107090466A publication Critical patent/CN107090466A/zh
Application granted granted Critical
Publication of CN107090466B publication Critical patent/CN107090466B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种双sgRNA表达质粒及其文库的构建方法。本发明所提供的方法一是利用两轮golden gate拼装技术,将预先设计在寡核苷酸上的编码双sgRNA中的间隔RNA的DNA片段插入到载体中;方法二是利用三轮golden gate拼装技术构建随机双敲除sgRNA表达质粒文库。本发明所提供的构建双sgRNA表达质粒文库的方法与现有方法相比,操作更加简便且大大缩短了构建时间。本发明对于鉴定非编码区基因的生物学功能以及鉴定基因与基因的相互作用具有重要意义。

Description

双sgRNA表达质粒及其文库的构建方法
技术领域
本发明属于生物技术领域,涉及一种双sgRNA表达质粒及其文库的构建方法。
背景技术
基因功能的筛选可以深入研究细胞内生理过程,了解疾病发生和发展过程,具有重要的作用。这通常需要对细胞内的基因进行沉默或者删除。最初研究者采用将转座子插入到基因组或者通过化学突变的方式进行基因突变[Carette J E,Guimaraes C P,Varadarajan M,et al.Haploid genetic screens in human cells identify hostfactors used by pathogens[J].Science,2009,326(5957):1231-1235.]。这种方式导致的突变基因的查找过程复杂,并没有得到广泛的应用。之后,RNA干扰(RNAi)技术的出现,在一定程度上解决了上述方法的问题。RNA干扰技术根据目标基因设计一系列短链RNA,使其在后转录过程中与目标基因mRNA互补结合,从而降解mRNA或阻止其翻译成蛋白质[MoffatJ,Grueneberg D A,Yang X,et al.A lentiviral RNAi library for human and mousegenes applied to an arrayed viral high-content screen[J].Cell,2006,124(6):1283-1298.]。
RNA干扰技术的出现,使研究者几乎可以干扰哺乳动物细胞内的所有基因。然而,该项技术仍存在一定的弊端。比如RNAi技术只能在一定程度上降低目标基因的表达水平,却不能完全抑制目标基因的表达。另外,RNA干扰作用依赖于短链RNA与目标mRNA的互补配对,容易因不完全匹配产生脱靶效应,干扰目标基因之外的其他基因表达水平,对最终结果造成不可预估的影响[Kaelin Jr W G.Molecular biology.Use and abuse of RNAi tostudy mammalian gene function[J].Science(New York,NY),2012,337(6093):421-422.]。功能基因的筛选仍需要一种操作简单、可以完全沉默基因表达的技术。
由RNA引导的CRISPR/Cas9(Clustered Regularly Interspaced ShortPalindromic Repeats,成簇的规律间隔短回文重复序列)系统自2013年起已经成为基因组编辑的新工具,并且由于其载体构建过程相较于另外两种编辑工具TALE、锌指蛋白更为方便,受到该领域研究者的追捧[Doudna,Jennifer A.,and Emmanuelle Charpentier."Thenew frontier of genome engineering with CRISPR-Cas9."Science 346.6213(2014):1258096.]。CRISPR/Cas9是最新出现的一种由RNA指导Cas核酸酶对靶向基因进行特定DNA修饰的技术[Mali,Prashant,et al."RNA-guided human genome engineering viaCas9."Science 339.6121(2013):823-826.]。CRISPR/Cas系统广泛分布于细菌和古生菌基因组中,是在进化过程中形成的一种适应性免疫系统,可以帮助降解入侵病毒或质粒DNA[B.Wiedenheft,S.H.Sternberg,J.A.Doudna,Nature 482,331(2012).]。在这一系统中,crRNA(CRISPR-derived RNA)通过碱基配对与tracrRNA(trans-activating crRNA)结合形成双链RNA,此tracrRNA/crRNA二元复合体指导Cas9蛋白在crRNA引导序列靶定位点剪切双链DNA,诱导细胞利用自身的非同源末端连接修复机制(non-homologous end joining,NHEJ),引起切割位点的DNA插入或缺失导致目标基因功能失活[Jinek M,Chylinski K,Fonfara I,et al.A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity.Science,2012,337(6096):816-821.]。在CRISPR II型系统中,Cas9基因是参与CRISPR免疫系统的唯一必需基因,是目前最常用来工程改造人工核酸酶的系统。为了方便使用,在人工构建的CRISPR/Cas9系统中,将tracrRNA和crRNA融合为一条,称为single guide RNA(sgRNA)[Mali,Prashant,et al."RNA-guided human genomeengineering via Cas9." Science 339.6121(2013):823-826.]。
目前,已有研究者基于CRISPR/Cas9技术开发高通量基因筛选、基因敲除技术,即针对目标基因,设计一系列sgRNA表达载体,利用慢病毒载体递送到细胞内表达。现有的基于CRISPR/Cas9基因敲除技术中,每个载体仅表达一条sgRNA。但是对于一些非编码蛋白质的DNA片段,为了探究其生物学功能,需要表达两条sgRNA,进行删除以探究其相关功能。除了单个基因敲除筛选外,为了了解基因与基因间的相互作用,对于一个特定的基因集的随机组合双敲除可以很好的了解基因与基因间的遗传相互作用。
Timothy Lu等人[Wong A S L,Choi G C G,Cui C H,et al.Multiplexedbarcoded CRISPR-Cas9screening enabled by CombiGEM[J].Proceedings of theNational Academy of Sciences,2016:201517883.]通过酶切连接的方式,首先将barcode插入到单个sgRNA中,然后通过酶切连接,将两个sgRNA串联起来,这种方法虽然能够构建双敲除文库,但是过程较为繁琐。
发明内容
本发明的目的是提供一种构建双sgRNA表达载体及双随机sgRNA表达载体文库的方法。
本发明所提供的构建双sgRNA表达载体的方法,是利用两轮golden gate拼装技术将预先设计好的用于表达双sgRNA的DNA片段插入到出发载体中,具体可包括:
(a1)利用golden gate拼装方法,采用IIs型限制性内切酶A、IIs型限制性内切酶E、IIs型限制性内切酶D和IIs型限制性内切酶F将DNA片段与出发载体1进行拼装,得到重组载体1;
所述DNA片段的序列自上游到下游依次含有:所述IIs型限制性内切酶A的识别序列、名称为sgRNA1的sgRNA的间隔RNA(spacer RNA,用于识别靶标序列)的编码序列、IIs型限制性内切酶B的识别序列、IIs型限制性内切酶C的识别序列、名称为sgRNA2的sgRNA的间隔RNA(spacer RNA,用于识别靶标序列)的编码序列、所述IIs型限制性内切酶D的识别序列;
所述出发载体1的序列自上游到下游依次含有启动子1序列、所述IIs型限制性内切酶E的识别序列、筛选标签1的编码序列、所述IIs型限制性内切酶F的识别序列、sgRNA骨架1编码序列;
所述DNA片段与所述出发载体1的目的片段中,所述IIs型限制性内切酶A切割产生的粘性末端overhang与所述IIs型限制性内切酶E切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶D切割产生的粘性末端overhang与所述IIs型限制性内切酶F切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶A切割产生的粘性末端overhang和所述IIs型限制性内切酶E切割产生的粘性末端overhang均不与所述IIs型限制性内切酶D切割产生的粘性末端overhang和所述IIs型限制性内切酶F切割产生的粘性末端overhang互补配对;
(a2)利用golden gate拼装方法,采用IIs型限制性内切酶G、所述IIs型限制性内切酶B、IIs型限制性内切酶H和所述IIs型限制性内切酶C将所述重组载体1与出发载体2进行拼装,得到重组载体2,所述重组载体2即为所述双sgRNA表达载体;
所述出发载体2的序列自上游到下游依次含有:所述IIs型限制性内切酶G的识别序列、sgRNA骨架2编码序列、筛选标签2的编码序列、启动子2序列、所述IIs型限制性内切酶H 的识别序列;
所述重组载体1与所述出发载体2的目的片段中,所述IIs型限制性内切酶G切割产生的粘性末端overhang与所述IIs型限制性内切酶B切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶H切割产生的粘性末端overhang与所述IIs型限制性内切酶C切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶G切割产生的粘性末端overhang和所述IIs型限制性内切酶B切割产生的粘性末端overhang均不与所述IIs型限制性内切酶H切割产生的粘性末端overhang和所述IIs型限制性内切酶C切割产生的粘性末端overhang互补配对;
所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F均不同于所述IIs型限制性内切酶B和所述IIs型限制性内切酶C。
所述双sgRNA表达载体能表达含有所述sgRNA1的完整的sgRNA和含有所述sgRNA2的完整的sgRNA。
在所述重组载体1含有所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和/或所述IIs型限制性内切酶F的识别序列时,所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和/或所述IIs型限制性内切酶F不同于所述IIs型限制性内切酶G和所述IIs型限制性内切酶H;在所述重组载体1不含所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F的识别序列时,对于所述IIs型限制性内切酶G和所述IIs型限制性内切酶H是否与所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F是否相同没有要求。
所述DNA片段满足可被所述IIs型限制性内切酶A和所述IIs型限制性内切酶D酶切的条件。
所述sgRNA骨架1和所述sgRNA骨架2均为完整sgRNA中除去间隔RNA的部分。
上述构建双sgRNA表达载体的方法中,所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F均可相同。所述IIs型限制性内切酶B、所述IIs型限制性内切酶C、所述IIs型限制性内切酶G和所述IIs型限制性内切酶H均可相同。
上述构建双sgRNA表达载体的方法中,所述sgRNA骨架1和所述sgRNA骨架2均可为含有完整sgRNA中除间隔RNA外的功能片段。
上述构建双sgRNA表达载体的方法中,所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F均可为BsaI。
所述IIs型限制性内切酶B、所述IIs型限制性内切酶C、所述IIs型限制性内切酶G和所述IIs型限制性内切酶H均可为Esp3I。
所述启动子1可为U6启动子。
所述启动子2可为H1启动子。
所述筛选标签1可为lacZ。
所述筛选标签2可为Amp抗性筛选标签。
所述sgRNA骨架2编码序列为序列2的第1278-1360位。
所述出发载体1上还可含有独立的筛选标签3的表达盒;所述筛选标签3具体可为Spec(R)。
更加具体的,所述出发载体1为pD408载体。所述出发载体2为pDS143载体。所述pD408载体的核苷酸序列为序列表中序列1。所述pDS143载体的核苷酸序列为序列表中的序列2。
在步骤(a1)中,所述DNA片段的5’端还可含有前向引物序列,3’端还可含有后向引物的结合序列。所述前向引物和所述后向引物可用于扩增获得所述DNA片段。
当利用上述方法制备双sgRNA表达载体文库时,步骤(a1)中DNA片段可为DNA片段库(即为所述DNA片段的集合,其中每种DNA片段表达出来的两种sgRNA的间隔RNA可相同可不同)。实践中,为了便于操作,可将所述DNA片段库中的所有寡核苷酸链合成在生物芯片上。
上述构建双sgRNA表达载体的方法得到的重组载体可以表达所述sgRNA1和所述sgRNA2。
利用上述构建双sgRNA表达载体的方法制备得到的双sgRNA表达载体或双sgRNA表达载体文库也属于本发明的保护范围。
本发明所提供的构建双随机sgRNA表达载体文库的方法,包括:
(c1)利用golden gate拼装方法,将DNA片段库中的DNA片段与出发载体3进行拼装,得到重组载体库3;利用golden gate拼装方法,将所述DNA片段库中的DNA片段与出发载体4进行拼装,得到重组载体库4;
所述DNA片段库中的每种DNA片段均编码一种sgRNA的间隔RNA(spacer RNA,用于识别靶标序列),所述DNA片段库中的每种DNA片段具有以下c11)或c12)的特征:
c11)所述DNA片段库中的每种DNA片段的两端分别各含有一个粘性末端overhang,将上游粘性末端overhang命名为粘性末端overhang1,将下游粘性末端overhang2;
c12)下述c12a)或c12b):
c12a)所述DNA片段库中的每个DNA片段自上游到下游均依次含有IIs型限制性内切酶N1的识别序列、sgRNA的间隔RNA的编码序列、IIs型限制性内切酶N2的识别序列;c12b)所述DNA片段库中的每个DNA片段自上游到下游均依次含有IIs型限制性内切酶N3的识别序列、sgRNA的间隔RNA的编码序列、IIs型限制性内切酶N4的识别序列;
所述出发载体3自上游到下游依次含有IIs型限制性内切酶M1的识别序列、启动子3序列、IIs型限制性内切酶M2的识别序列、筛选标签3的编码序列、IIs型限制性内切酶M3的识别序列、sgRNA骨架3编码序列、IIs型限制性内切酶M4的识别序列;所述IIs型限制性内切酶M1和所述IIs型限制性内切酶M4均不同于所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3;
所述出发载体4自上游到下游依次含有IIs型限制性内切酶M5的识别序列、启动子4序列、IIs型限制性内切酶M6的识别序列、筛选标签4的编码序列、IIs型限制性内切酶M7的识别序列、sgRNA骨架4编码序列、IIs型限制性内切酶M8的识别序列;所述IIs型限制性内切酶M5和所述IIs型限制性内切酶M8均不同于所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7;
所述出发载体3的目的片段中,所述IIs型限制性内切酶M2切割产生的粘性末端overhang不与所述IIs型限制性内切酶M3切割产生的粘性末端overhang互补配对;所述出发载体4的目的片段中,所述IIs型限制性内切酶M6切割产生的粘性末端overhang不与所述IIs型限制性内切酶M7切割产生的粘性末端overhang互补配对;
所述粘性末端overhang1与所述出发载体3目的片段中所述IIs型限制性内切酶M2切割 产生的粘性末端overhang及所述出发载体4目的片段中所述IIs型限制性内切酶M6切割产生的粘性末端overhang均互补配对;所述粘性末端overhang2与所述出发载体3目的片段中所述IIs型限制性内切酶M3切割产生的粘性末端overhang及所述出发载体4目的片段中所述IIs型限制性内切酶M7切割产生的粘性末端overhang均互补配对;
所述DNA片段库中DNA片段中所述IIs型限制性内切酶N1切割产生的粘性末端overhang与所述出发载体3目的片段中所述IIs型限制性内切酶M2切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N2切割产生的粘性末端overhang与所述出发载体3目的片段中所述IIs型限制性内切酶M3切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N3切割产生的粘性末端overhang与所述出发载体4目的片段中所述IIs型限制性内切酶M6切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N4切割产生的粘性末端overhang与所述出发载体4目的片段中所述IIs型限制性内切酶M7切割产生的粘性末端overhang互补配对;
所述DNA片段库中的每种DNA片段满足c11)所述特征,采用所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3将所述DNA片段库中的DNA片段与所述出发载体3进行拼装,采用所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7将所述DNA片段库中的DNA片段与所述出发载体4进行拼装;
所述DNA片段库中的每种DNA片段满足c12)所述特征,采用所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶N1和所述IIs型限制性内切酶N2将所述DNA片段库中的DNA片段与所述出发载体3进行拼装,采用所述IIs型限制性内切酶M6、所述IIs型限制性内切酶M7、所述IIs型限制性内切酶N3和所述IIs型限制性内切酶N4将所述DNA片段库中的DNA片段与所述出发载体4进行拼装;
(c2)利用golden gate拼装方法,采用所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、IIs型限制性内切酶M7和IIs型限制性内切酶M8将重组载体库3中的重组载体、重组载体库4中的重组载体与出发载体5进行拼装,得到重组载体库5,所述重组载体库5即为所述双随机sgRNA表达载体文库;
所述出发载体5的序列自上游到下游依次含有所述IIs型限制性内切酶M9的识别序列、筛选标签5的编码序列、所述IIs型限制性内切酶M10的识别序列;
所述出发载体3、所述出发载体4和所述出发载体5的目的片段中满足y1)、y2)和y3)以及x1)-x8)中的任一种:
y1)所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对;
y2)所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对;
y3)所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x1)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x2)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x3)所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x4)所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x5)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末 端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x6)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x7)所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x8)所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶N1和所述IIs型限制性内切酶N2均不同于所述IIs型限制性内切酶M1和所述IIs型限制性内切酶M4;
所述IIs型限制性内切酶M6、所述IIs型限制性内切酶M7、所述IIs型限制性内切酶N3和所述IIs型限制性内切酶N4均不同于所述IIs型限制性内切酶M5和所述IIs型限制性内切酶M8。
所述双随机sgRNA表达载体文库中的载体均能表达两个含有随机sgRNA的完整的sgRNA。
所述DNA片段库中的每种DNA片段满足c12)所述特征时,所述DNA片段库中的每个DNA片段还满足可被所述IIs型限制性内切酶N1和所述IIs型限制性内切酶N2酶切或被所述IIs型限制性内切酶N3和所述IIs型限制性内切酶N4酶切的条件。
所述sgRNA骨架3和所述sgRNA骨架4均为完整sgRNA中除去间隔RNA的部分。
在所述重组载体库3中的重组载体含有所述IIs型限制性内切酶M2和/或所述IIs型限制性内切酶M3的识别序列时,所述IIs型限制性内切酶M2和/或所述IIs型限制性内切酶M3不同于所述IIs型限制性内切酶M9和/或所述IIs型限制性内切酶M10;在所述重组载体库3中的重组载体不含所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3的识别序列时,对所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3是否同于所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10没有要求。在所述重组载体库4中的重组载体含有所述IIs型限制性内切酶M6和/或所述IIs型限制性内切酶M7的识别序列时,所述IIs型限制性内切酶M6和/或所述IIs型限制性内切酶M7不同于所述IIs型限制性内切酶M9和/或所述IIs型限制性内切酶M10;在所述重组载体库4中的重组载体不含所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7的识别序列时,对所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7是否同于所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10没有要求。
上述构建双随机sgRNA表达载体文库的方法中,所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7均可相同。所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10均可相同。
上述构建双随机sgRNA表达载体文库的方法中,所述sgRNA骨架3和所述sgRNA骨架4均可为含有完整sgRNA中除间隔RNA外的功能片段。
上述构建双随机sgRNA表达载体文库的方法中,所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7均可为BsaI。
所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10均可为Esp3I。
所述启动子3可为U6启动子。
所述启动子4可为7Sk启动子。
所述筛选标签3可为lacZ。
所述筛选标签4可为lacZ。
所述sgRNA骨架3编码序列可为序列3的第1443-1524位。
所述sgRNA骨架4编码序列可为序列4的第1435-1517位。
更加具体的,所述出发载体3为pDC007载体。所述出发载体4为pDC002载体。所述出发载体5为pDC005载体。所述pDC007载体序列为序列3。所述pDC002载体为序列4。所述pDC005载体为序列5。
上述构建双随机sgRNA表达载体文库的方法得到的重组载体库中的重组载体可以表达两个sgRNA。所述重组载体库5含有至少一个重组载体。
利用上述构建双随机sgRNA表达载体文库的方法制备得到的双随机sgRNA表达载体文库也属于本发明的保护范围。
所述双sgRNA表达载体或双sgRNA表达载体文库或所述双随机sgRNA表达载体文库在鉴定非编码区基因的生物学功能中的应用也属于本发明的保护范围。
所述双sgRNA表达载体或双sgRNA表达载体文库或所述双随机sgRNA表达载体文库在鉴定基因与基因相互作用中的应用也属于本发明的保护范围。
下述P1)或P2)的产品也属于本发明的保护范围:
P1)用于构建双sgRNA表达载体的成套试剂,由所述出发载体1、所述出发载体2、所述出发载体3、所述出发载体4和所述出发载体5中的至少两种组成;
P2)所述出发载体1、所述出发载体2、所述出发载体3、所述出发载体4或所述出发载体5。
下述Q1)-Q8)任一所述应用也属于本发明的保护范围:
Q1)所述双sgRNA表达载体或双sgRNA表达载体文库或所述双随机sgRNA表达载体文库在鉴定非编码区基因的生物学功能中的应用;
Q2)所述双sgRNA表达载体或双sgRNA表达载体文库或所述双随机sgRNA表达载体文库在鉴定基因与基因相互作用中的应用;
Q3)所述产品在构建sgRNA表达载体中的应用:
Q4)所述产品在制备构建sgRNA表达载体产品中的应用;
Q5)所述产品在鉴定非编码区基因的生物学功能中的应用;
Q6)所述产品在鉴定基因与基因相互作用中的应用;
Q7)所述构建双sgRNA表达载体的方法或所述构建双随机sgRNA表达载体文库的方法在鉴定非编码区基因的生物学功能中的应用;
Q8)所述构建双sgRNA表达载体的方法或所述构建双随机sgRNA表达载体文库的方法在鉴定基因与基因相互作用中的应用。
本发明中,所述粘性末端overhang是指粘性末端突出出来的单个核苷酸或含有2个或2个以上核苷酸的单链DNA。
下述Y1或Y2的方法也属于本发明的保护范围:
Y1、一种构建双sgRNA表达质粒的方法,包括如下步骤:
(a1)合成用于表达sgRNA1和sgRNA2的DNA片段,所述DNA片段自上游到下游依次含有IIs型限制性内切酶A的识别序列、用于表达所述sgRNA1上的间隔序列的DNA序列、IIs型限制性内切酶B的识别序列、用于表达所述sgRNA2上的间隔序列的DNA序列、IIs型限制性内切酶A的识别序列;
(a2)选择符合如下条件的空载sgRNA骨架载体作为出发质粒1:自上游到下游依次含有启动子1、所述IIs型限制性内切酶A的识别序列、筛选标签序列1、所述IIs型限制性内切酶A的识别序列、sgRNA骨架序列1;
(a3)基于golden gate拼装技术,采用所述IIs型限制性内切酶A将所述DNA片段克隆到所述出发质粒1中,得到重组质粒1;
(a4)选择符合如下条件的空载sgRNA骨架载体作为出发质粒2:自上游到下游依次含有所述IIs型限制性内切酶B的识别序列、sgRNA骨架序列2、筛选标签序列2、启动子2、所述IIs型限制性内切酶B的识别序列;
(a5)基于golden gate拼装技术,采用所述IIs型限制性内切酶B将所述重组质粒1与所述出发质粒2进行重组,得到能够同时表达所述sgRNA1和所述sgRNA2的重组质粒2,所述重组质粒2即为所述双sgRNA表达质粒;
Y2、一种构建双sgRNA表达质粒的方法,包括如下步骤:
(b1)合成用于表达sgRNA1和sgRNA2的DNA片段,所述DNA片段自上游到下游依次含有IIs型限制性内切酶A的识别序列、用于表达所述sgRNA1上的间隔序列的DNA序列、IIs型限制性内切酶B的识别序列、用于表达所述sgRNA2上的间隔序列的DNA序列、IIs型限制性内切酶A的识别序列;
(b2)选择符合如下条件的空载sgRNA骨架载体作为出发质粒1:自上游到下游依次含有启动子1、所述IIs型限制性内切酶A的识别序列、筛选标签序列1、所述IIs型限制性内切酶A的识别序列、sgRNA骨架序列1;
(b3)基于golden gate拼装技术,采用所述IIs型限制性内切酶A将所述DNA片段克隆到所述出发质粒1中,得到重组质粒1;
(b4)选择符合如下条件的空载sgRNA骨架载体作为出发质粒2:自上游到下游依次含有所述IIs型限制性内切酶B的识别序列、sgRNA骨架序列2、loxP序列、筛选标签序列2、loxP序列、启动子2、所述IIs型限制性内切酶B的识别序列;
(b5)基于golden gate拼装技术,采用所述IIs型限制性内切酶B将所述重组质粒1与所述出发质粒2进行重组,得到能够同时表达所述sgRNA1和所述sgRNA2且携带有“loxP序列-筛选标签序列2-loxP序列”的重组质粒2;
(b6)通过Cre/loxp位点重组将所述重组质粒2中的所述筛选标签序列2删除,得到重组质粒3,所述重组质粒3即为所述双sgRNA表达质粒。
本发明基于golden gate拼接技术,开发了两步同时串联或随机双敲除sgRNA文库的构建方法,与现有方法相比,操作更加简便且大大缩短了构建时间。本发明对于鉴定非编码区基因的生物学功能以及鉴定基因与基因的相互作用具有重要意义。
附图说明
图1为实施例1构建串联双sgRNA表达质粒文库的流程图。
图2为实施例2构建双随机sgRNA表达质粒文库的流程图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、串联双sgRNA表达质粒文库的构建及鉴定
本实施例设计了12000条DNA片段,每条DNA片段均含有两条sgRNA的间隔RNA(spacer RNA,即sgRNA中用于识别靶标序列的序列)编码序列,利用golden gate无缝拼接技术,利用芯片合成oligo文库,首先利用golden gate技术,将DNA片段插入到缺少sgRNA的间隔RNA编码序列的表达载体中,然后利用golden gate技术将第一个sgRNA公用骨架和第二个sgRNA的启动子序列插入到载体中。最终实现了成功构建出7908条sgRNA对双敲除质粒文库。具体流程见图1。
一、串联双sgRNA表达质粒文库的构建
1、pD408质粒(Plenti-U6-BsaI-lacZ-BsaI-CMV-bla)的核酸序列为序列1,其中序列第1238-1497位核苷酸为启动子U6的序列,第1504-1499位为第一个IIs型限制性内切酶BsaI的识别序列,第1494-1497位为第一个IIs型限制性内切酶BsaI酶切后产生的粘性末端overhang,第1507-1944位核苷酸为lacZ序列,第1965-1970位为第二个IIs型限制性内切酶BsaI的识别序列,第1972-1975位为第二个IIs型限制性内切酶BsaI酶切后产生的粘性末端overhang,第2075-2705位核苷酸为CMV序列,第2796-3194位核苷酸为bla序列。该载体为空载的sgRNA骨架载体。
2、将设计的12000种寡核苷酸链合成在生物芯片上,其中10个寡核苷酸链的序列为序列表中序列6-序列15,以做示例。这12000种寡核苷酸链中,每种寡核苷酸链序列的第1-20位核苷酸为前向引物的序列,第21-26位核苷酸为第一个IIs型限制性内切酶BsaI的识别序列,第28-31位为第一个IIs型限制性内切酶BsaI酶切后产生的粘性末端overhang,第32-50位核苷酸为一个sgRNA(sgRNA1)的间隔RNA(spacer RNA)的编码序列,第56-61位核苷酸为第一个IIs型限制性内切酶Esp3I(BsmB I)的识别序列,第51-54位为第一个IIs型限制性内切酶Esp3I酶切后产生的粘性末端overhang,第68-73位核苷酸为第二个IIs型限制性内切酶Esp3I的识别序列,第75-78位为第二个IIs型限制性内切酶Esp3I酶切后产生的粘性末端overhang,第79-98位核苷酸为另一个sgRNA(sgRNA2)的间隔RNA(spacer RNA)的编码序列,第104-109位核苷酸为第二个IIs型限制性内切酶BsaI的识别序列,第99-102位为第二个IIs型限制性内切酶BsaI酶切后产生的粘性末端overhang,第110-129位核苷酸为反向引物的结合序列。
这12000种寡核苷酸链的前向引物与反向引物共10对(如表1所示),根据前向引物和反向引物的不同,将这12000种寡核苷酸链分为10个亚库,从而分别进行下游实验,减少实验误差。这12000种寡核苷酸链的区别仅在于:前向引物和反向引物的序列以及间隔RNA的编码序列。每个亚库中寡核苷酸链的前向引物和反向引物均分别相同,每个亚库中寡核苷酸链的不同之处仅在于每两个寡核苷酸链间的间隔RNA的编码序列均不同。
表1扩增寡核苷酸链文库的引物
文库序号 前向引物(5’-3’) 反向引物(5’-3’)
1 TGGTGATAGGTAAGGATGGC GTAATCGCAATACTGAGCCG
2 TCGACACCACTATACACCAC TCTTTATACTCTCACGGGCC
3 CATGTAGTGCAGCCATTCTC TACTTTTGATTGCTGTGCCC
4 TCTAGGTTTCGGCTTCATGT TATAGTTCCTCCCATGCACC
5 ATACTGCTGGGCTGGATATC TCCTGAGAGAATACGGATGC
6 ACCCAAAGAACTCGATTCCT ACCTCCTCACTCCATTTAGC
7 AGTCTTAGGCTTGGAGTGTC GGGATCACTACTCAGCCTAC
8 GCTCTCCGCTATCAGTAACA TGGGTCTAGTGAACTTCGTC
9 GCCTATCCTCTAGTTCTGCC TCGAGTTAGATTGTCACCCC
10 AACACACCTACCTCTAGCAC GTCTGGTCCCTGTAGTGTTC
11 ATGGGAGGTGATACTAACGC ACTACGATCCAATCCCTTGC
3、洗脱生物芯片上的寡核苷酸链,利用表1中的前向引物和反向引物扩增相应亚库寡核苷酸序列,得到12000种DNA片段组成的DNA片段文库。
4、利用golden gate技术,采用IIs型限制性内切酶BsaI将DNA片段文库中的DNA片段插入到pD408质粒中,因为pD408质粒中含有lacZ序列,所以空载体在蓝白筛选过程中显蓝色,而插入成功的重组载体中由于缺失lacZ序列,因此刮取绝大多数白斑菌落进行下一步反应。
5、取第4步的反应所得重组质粒,与pDS143质粒(sgRNA-AMP-H1)进行第二步goldengate反应,pDS143质粒的核苷酸序列为序列表中序列2,其中第1271-1276位为第一个IIs型限制性内切酶Esp3I的识别序列,第1278-1360位核苷酸为sgRNA骨架编码序列,第1529-2487位核苷酸为氨苄青霉素序列,第2591-2835位核苷酸为H1启动子序列;第2837-2842位为第二个IIs型限制性内切酶Esp3I的识别序列。通过golden gate反应拼装,采用IIs型限 制性内切酶Esp3I将pDS143质粒中的sgRNA骨架与H1启动子插入到第4步反应所得的重组质粒中,因为pDS143质粒中含有amp抗性基因,因此重组正确的载体中携带有Amp(R)所示的抗生素抗性基因,利用壮观霉素(pD408质粒中携带Spec(R)表示的壮观霉素抗性基因)和氨苄青霉素双抗性筛选得到第二次golden gate重组正确质粒文库,即为串联双sgRNA表达质粒文库。
二、串联双sgRNA表达质粒文库的鉴定
为了验证步骤一所构建的文库覆盖度情况,因为双sgRNA表达体系两条sgRNA之间长度大于一般illumina高通量测序文库要求的800bp,因此本发明采用了环化测序法验证文库构建情况。具体操作如下:
选取pD408质粒(Plenti-U6-BsaI-lacZ-BsaI-CMV-bla),根据U6启动子上游的AgeI酶切位点和CMV启动子上游的XhoI酶切位点,对步骤一所得的质粒文库进行AgeI和XhoI双酶切。通过预先退火的linker寡核苷酸双链与酶切片段进行连接,连接片段不再有AgeI和XhoI酶切位点。表2为linker寡核苷酸链的序列。
表2linker寡核苷酸链的序列
正向核苷酸链序列(5’-3’) 反向核苷酸链序列(5’-3’)
TCGATATCCTGATATGAATAAATTGCAGTG CCGGCACTGCAATTTATTCATATCAGGATA
由于表1中的前向引物是根据H1启动子的序列进行设计的,后向引物是根据sgRNA后的序列的序列进行设计的,因此采用前向引物和后向引物进行PCR扩增,前向引物结合在H1启动上,反向引物结合在第一条sgRNA后端,从而可以特异性扩增两条sgRNA表达序列。
将含有两条sgRNA的PCR片段进行illumina高通量测序,得到设计的寡核苷酸文库的丰度和覆盖度。
结果显示:根据illumina高通量测序结果,成功的构建了7908个双sgRNA文库质粒。因此,证明利用golden gate拼装技术,可以有效的构建串联sgRNA表达质粒。
实施例2、双随机sgRNA表达质粒文库的构建及鉴定
本实施例开发了双随机sgRNA表达质粒文库的构建方法,利用U6和7Sk启动子分别表达两条sgRNA,基于golden gate拼接技术,将两个用于表达sgRNA的间隔RNA(spacerRNA)的DNA片段随机连接到终载体中,从而得到双随机sgRNA表达质粒,成功的应用于84个基因的双敲除载体文库构建。具体流程见图2。
一、双随机sgRNA表达质粒文库的构建
1、批量合成了84个基因每个三对共6种寡核苷酸链(每种寡核苷酸链均编码sgRNA的间隔RNA)(84个基因共计504种寡核苷酸链),以及40种作为对照的寡核苷酸链,共计544种寡核苷酸链。其中一个基因的6种寡核苷酸链的序列为序列表中序列16-21。这544种寡核苷酸链分为两类:第一类的第1-4位为粘性末端overhang;第二类的第20-23位为粘性末端overhang,每类的粘性末端overhang可以与Esp3I或BsaI的粘性末端overhang兼容。
2、将第一步合成的84个基因的504种寡核苷酸链,进行退火和磷酸化,退火磷酸化后得到的每个DNA片段(双链DNA)的两端分别各含有一个粘性末端overhang。
3、pDC007质粒(Esp3I-U6-BsaI-lacZ-BsaI-sgRNA-Esp3I)的核酸序列为序列表中序列3,其中第738-743、1531-1536位核苷酸为两个IIs型限制性内切酶Esp3I的识别序列,第747-1015位核苷酸为启动子U6的表达序列,第1017-1022、1436-1441位核苷酸为两个IIs型限制性内 切酶BsaI的识别序列,第1023-1435位核苷酸为lacZ基因序列,第1443-1524位核苷酸为sgRNA共用骨架编码序列。pDC007质粒中两个IIs型限制性内切酶BsaI切割产生的粘性末端overhang分别与步骤2得到的双链DNA的两端的粘性末端overhang兼容(即两个目的片段的粘性末端overhang互补配对)。首先将第2步的磷酸化产物,基于golden gate拼装技术,采用IIs型限制性内切酶BsaI连接到pDC007质粒中。因为pDC007质粒中含有lacZ序列,所以空载体在蓝白筛选过程中显蓝色,而连接成功的重组载体中由于缺失lacZ序列,因此刮取绝大多数白斑菌落进行以下反应。
4、pDC002质粒(Esp3I-7Sk-BsaI-lacZ-BsaI-sgRNA-Esp3I)的核酸序列为序列表中序列4,其中第743-738、1583-1588位核苷酸为两个IIs型限制性内切酶Esp3I的识别序列,第749-1007位核苷酸为启动子7Sk的表达序列,第1009-1014、1428-1433位核苷酸为两个IIs型限制性内切酶BsaI的识别序列,第1016-1427位核苷酸为lacZ基因序列,第1435-1517位核苷酸为sgRNA共用骨架编码序列。pDC002质粒中两个IIs型限制性内切酶BsaI切割产生的粘性末端overhang分别与步骤2得到的双链DNA的两端的粘性末端overhang兼容(即两个目的片段的粘性末端overhang反向互补)。首先将第2步的磷酸化产物,基于goldengate拼装技术,采用IIs型限制性内切酶BsaI连接到pDC002质粒中。因为pDC002质粒中含有lacZ序列,所以空载体在蓝白筛选过程中显蓝色,而连接成功的重组载体中由于缺失lacZ序列,因此刮取绝大多数白斑菌落进行以下反应。
5、pDC005质粒(pLenti-Esp3I-lacZ-Esp3I-hef1a-EYFP-puro)的核酸序列为序列表中序列5,其中第1206-1211、1625-1630位核苷酸为两个IIs型限制性内切酶Esp3I的识别序列,第1212-1618位核苷酸为lacZ基因序列,第1733-2825位核苷酸为hef1a启动子序列,第2924-3640位核苷酸为EYFP序列,第3713-4312位核苷酸为puro序列。由于pDC007质粒中U6上游的Esp3I切割产生的粘性末端overhang与pDC005质粒中的第一个Esp3I切割产生的粘性末端overhang兼容,pDC007质粒中sgRNA下游Esp3I切割产生的粘性末端overhang与pDC002质粒7Sk启动子上游的Esp3I切割产生的粘性末端overhang兼容,pDC002质粒中sgRNA下游的Esp3I切割产生的粘性末端overhang与pDC005质粒的第二个Esp3I切割产生的粘性末端overhang兼容,因此可以基于golden gate拼接技术将步骤3和步骤4获得的pDC007和pDC002重组产物连接进入pDC005质粒中。
按照步骤2-5利用40种作为对照的寡核苷酸链进行对照实验。
6、构建成功的载体在蓝白斑筛选下为白斑,刮取白斑菌落,得到双随机sgRNA表达质粒文库。
二、双随机sgRNA表达质粒文库的鉴定
通过对双随机sgRNA表达质粒文库进行高通量测序,获得不同子库(共12个子库,这12个子库是将步骤一得到的双随机sgRNA表达质粒文库随机分为12部分得到的)的覆盖度(覆盖度是指能表达两个sgRNA的表达质粒占测序总质粒数的百分比),见表3。可以看到利用本实施例的方法可以高覆盖的构建随机双sgRNA敲除文库。
表3随机双敲除覆盖度表
库名 1 2 3 4 5 6 7 8 9 10 11 12
覆盖度 81% 77% 64% 77% 76% 80% 81% 78% 80% 80% 80% 79%
<110> 清华大学、北京合生基因科技有限公司
<120> 双sgRNA表达质粒及其文库的构建方法
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 10144
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
caaaggatag agataaaaga caccaaggaa gctttagaca agatagagga agagcaaaac 60
aaaagtaaga ccaccgcaca gcaagcggcc gctgatcttc agacctggag gaggagatat 120
gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg 180
agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat 240
aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 300
gacgctgacg gtacaggcca gacaattatt gtctggtata gtgcagcagc agaacaattt 360
gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaagca 420
gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat 480
ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag 540
taataaatct ctggaacaga tttggaatca cacgacctgg atggagtggg acagagaaat 600
taacaattac acaagcttaa tacactcctt aattgaagaa tcgcaaaacc agcaagaaaa 660
gaatgaacaa gaattattgg aattagataa atgggcaagt ttgtggaatt ggtttaacat 720
aacaaattgg ctgtggtata taaaattatt cataatgata gtaggaggct tggtaggttt 780
aagaatagtt tttgctgtac tttctatagt gaatagagtt aggcagggat attcaccatt 840
atcgtttcag acccacctcc caaccccgag gggacccgac aggcccgaag gaatagaaga 900
agaaggtgga gagagagaca gagacagatc cattcgatta gtgaacggat cggcactgcg 960
tgcgccaatt ctgcagacaa atggcagtat tcatccacaa ttttaaaaga aaagggggga 1020
ttggggggta cagtgcaggg gaaagaatag tagacataat agcaacagac atacaaacta 1080
aagaattaca aaaacaaatt acaaaaattc aaaattttcg ggtttattac agggacagca 1140
gagatccagt ttggttaatt aacaactttg tatagaaaag ttggctccga atttctcgag 1200
gaattccaat tgaccatgac cggtttgtcg acaagcttcc cttcaccgag ggcctatttc 1260
ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata attggaatta 1320
atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc 1380
ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa 1440
cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccgtga 1500
gaccgagaga gggatccggc gccgctacag ggcgcgtccc attcgccatt caggctgcgc 1560
aactgttggg aagggcgatc ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg 1620
ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtc acgacgttgt 1680
aaaacgacgg ccagtgagcg cgcgtaatac gactcactat agggcgaatt gggtaccggg 1740
ccccccctcg aggtcctcca gcttttgttc cctttagtga gggttaattg cgcgcttggc 1800
gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 1860
catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 1920
attaattgcg ttgcgctcac tgcccgcttt ccaccggtgt cgacggtctc agttttagag 1980
ctagaaatag caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag 2040
tcggtgcttt ttttaaagaa ttctcgacct cgagacaaat ggcagtaccg tattaccgcc 2100
atgcattagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 2160
gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 2220
cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 2280
acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 2340
tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 2400
ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 2460
tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc 2520
acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa 2580
tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag 2640
gcgtgtacgg tgggaggtct atataagcag agctggttta gtgaaccgtc agatccgcta 2700
gttaagggcc cggcgcgcct aaggtacccc cgggtaactg atcataattc gacccaagtt 2760
tgtacaaaaa agcaggctga actctagatg ccaccatggc caagcctttg tctcaagaag 2820
aatccaccct cattgaaaga gcaacggcta caatcaacag catccccatc tctgaagact 2880
acagcgtcgc cagcgcagct ctctctagcg acggccgcat cttcactggt gtcaatgtat 2940
atcattttac tgggggacct tgtgcagaac tcgtggtgct gggcactgct gctgctgcgg 3000
cagctggcaa cctgacttgt atcgtcgcga tcggaaatga gaacaggggc atcttgagcc 3060
cctgcggacg gtgccgacag gtgcttctcg atctgcatcc tgggatcaaa gccatagtga 3120
aggacagtga tggacagccg acggcagttg ggattcgtga attgctgccc tctggttatg 3180
tgtgggaggg ctaataccca gctttcttgt acaaagtggt gaattccggc aattcgatat 3240
caagcttatc gataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 3300
taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 3360
tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct 3420
ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga 3480
cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc 3540
tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac 3600
aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt 3660
tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt 3720
cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc 3780
tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc 3840
gcatcgatac cgtcgacctc gagtcctaga aaaacatgga gcaatcacaa gtagcaatac 3900
agcagctacc aatgctgatt gtgcctggct agaagcacaa gaggaggagg aggtgggttt 3960
tccagtcaca cctcaggtac ctttaagacc aatgacttac aaggcagctg tagatcttag 4020
ccacttttta aaagaaaagg ggggactgga agggctaatt cactcccaac gaagacaaga 4080
tatccttgat ctgtggatct accacacaca aggctacttc cctgattggc agaactacac 4140
accagggcca gggatcagat atccactgac ctttggatgg tgctacaagc tagtaccagt 4200
tgagcaagag aaggtagaag aagccaatga aggagagaac acccgcttgt tacaccctgt 4260
gagcctgcat gggatggatg acccggagag agaagtatta gagtggaggt ttgacagccg 4320
cctagcattt catcacatgg cccgagagct gcatccggac tgtactgggt gtctctggtt 4380
agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 4440
ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 4500
ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcaggg cccgtttaaa 4560
cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 4620
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 4680
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 4740
acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta 4800
tggcttctga ggcggaaaga accagctggg gctctagggg gtatccccac gcgccctgta 4860
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 4920
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 4980
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 5040
acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 5100
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 5160
aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 5220
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaattaat 5280
tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 5340
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 5400
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 5460
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 5520
actaattttt tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa 5580
gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg gagcttgtat 5640
atccattttc ggatctgatc agcacgtgtt gacaattaat catcggcata gtatatcggc 5700
atagtataat acgacaaggt gaggaactaa accatggcca agttgaccag tgccgttccg 5760
gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc 5820
tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc 5880
atcagcgcgg tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc 5940
ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc 6000
tccgggccgg ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc 6060
gacccggccg gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtgctacga 6120
gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 6180
gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 6240
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6300
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6360
catgtctgta taccgtcgac ctctagctag agcttggcgt aatcatggtc atagctgttt 6420
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 6480
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 6540
cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 6600
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 6660
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 6720
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 6780
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 6840
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 6900
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 6960
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 7020
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 7080
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 7140
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 7200
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 7260
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 7320
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 7380
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 7440
aacgaaaact cacgttaagg gattttggtc atgaccagcc aggacagaaa tgcctcgact 7500
tcgctgctac ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc 7560
cagtggacat aagcctgttc ggttcgtaag ctgtaatgca agtagcgtat gcgctcacgc 7620
aactggtcca gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg 7680
gcttgttatg actgtttttt tggggtacag tctatgcctc gggcatccaa gcagcaagcg 7740
cgttacgccg tgggtcgatg tttgatgtta tggagcagca acgatgttac gcagcagggc 7800
agtcgcccta aaacaaagtt aaacattatg agggaagcgg tgatcgccga agtatcgact 7860
caactatcag aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta 7920
catttgtacg gctccgcagt ggatggcggc ctgaagccac acagtgatat tgatttgctg 7980
gttacggtga ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg 8040
gaaacttcgg cttcccctgg agagagcgag attctccgcg ctgtagaagt caccattgtt 8100
gtgcacgacg acatcattcc gtggcgttat ccagctaagc gcgaactgca atttggagaa 8160
tggcagcgca atgacattct tgcaggtatc ttcgagccag ccacgatcga cattgatctg 8220
gctatcttgc tgacaaaagc aagagaacat agcgttgcct tggtaggtcc agcggcggag 8280
gaactctttg atccggttcc tgaacaggat ctatttgagg cgctaaatga aaccttaacg 8340
ctatggaact cgccgcccga ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc 8400
cgcatttggt acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg 8460
gcaatggagc gcctgccggc ccagtatcag cccgtcatac ttgaagctag acaggcttat 8520
cttggacaag aagaagatcg cttggcctcg cgcgcagatc agttggaaga atttgtccac 8580
tacgtgaaag gcgagatcac caaggtagtc ggcaaataat catgagcgga tacatatttg 8640
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 8700
ctgacgtcga cggatcggga gatctcccga tcccctatgg tgcactctca gtacaatctg 8760
ctctgatgcc gcatagttaa gccagtatct gctccctgct tgtgtgttgg aggtcgctga 8820
gtagtgcgcg agcaaaattt aagctacaac aaggcaaggc ttgaccgaca attgcatgaa 8880
gaatctgctt agggttaggc gttttgcgct gcttcgcgat gtacgggcca gatatacgcg 8940
ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat tagttcatag 9000
cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 9060
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 9120
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 9180
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 9240
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 9300
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 9360
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 9420
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 9480
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agcgcgtttt gcctgtactg 9540
ggtgtctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 9600
tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 9660
gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 9720
gtggcgcccg aacagggact tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 9780
gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 9840
aaaaattttg actagcggag gctagaagga gagagatggg tgcgagagcg tcagtattaa 9900
gcgggggaga attagatcgc gatgggaaaa aattcggtta aggccagggg gaaagaaaaa 9960
atataaatta aaacatatag tatgggcaag cagggagcta gaacgattcg cagttaatcc 10020
tggcctgtta gaaacatcag aaggctgtag acaaatactg ggacagctac aaccatccct 10080
tcagacagga tcagaagaac ttagatcatt atataataca gtagcaaccc tctattgtgt 10140
gcat 10144
<210> 2
<211> 4508
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg 60
caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt 120
tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg actgaatccg 180
gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc cagccattac 240
gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat tgcgcctgag 300
cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc gaatgcaacc 360
ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga tattcttcta 420
atacctggaa tgctgttttt ccggggatcg cagtggtgag taaccatgca tcatcaggag 480
tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag tttagtctga 540
ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga aacaactctg 600
gcgcatcggg cttcccatac aagcgataga ttgtcgcacc tgattgcccg acattatcgc 660
gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc ggcctcgacg 720
tttcccgttg aatatggctc ataacacccc ttgtattact gtttatgtaa gcagacagtt 780
ttattgttca tgatgatatt attttatctt gtgcaatgta acatcagaga ttttgagaca 840
cgggccagag ctgccaggaa acagctatga ccatgtaata cgactcacta taggggatat 900
cagctggatg gcaaataatg attttatttt gactgatagt gacctgttcg ttgcaacaaa 960
ttgataagca atgctttctt ataatgccaa ctttgtacaa gaaagctggg tagatcagtt 1020
atctagtctc gagtcactat ctagatttct ttttcttagc ttgaccagct ttcttagtag 1080
cagcaggacg ctttgagccg ccaccactag tctgtcacca atcctgtccc tagtagcggc 1140
cgcgtcgacg tttaaacctc gagattaccc tgttatccct attaattaag gatcttaaaa 1200
acattataca atactacaag cataaaaacg caccaagctt gcatgcctgc aggtcgacga 1260
ttttctcgag cgtctcagtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 1320
tatcaacttg aaaaagtggc accgagtcgg tgcttttttt agatcttctt cgtcgacccg 1380
caattcgcct agctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 1440
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 1500
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 1560
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 1620
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcgt gacccacgct 1680
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 1740
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 1800
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 1860
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 1920
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 1980
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 2040
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 2100
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 2160
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 2220
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 2280
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 2340
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 2400
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 2460
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 2520
acgtcgacgg atcgggagat ctcccgatcc cctatggtgc actctcagta caatctgctc 2580
tgatgccgca agcccttcgt cgacccgcaa ttcgaacgct gacgtcatca acccgctcca 2640
aggaatcgcg ggcccagtgt cactaggcgg gaacacccag cgcgcgtgcg ccctggcagg 2700
aagatggctg tgagggacag gggagtggcg ccctgcaata tttgcatgtc gctatgtgtt 2760
ctgggaaatc accataaacg tgaaatgtct ttggatttgg gaatcttata agttctgtat 2820
gagaccacag atctatgaga cgatctctag aggatccccg ggtacccaat tcgccctata 2880
gtgagtgagc cgccaccccc gggtgagccg ccaccgacct tccgcttctt ctttggcatg 2940
gtggcaccgg tgcggccgcc aattctccgg taatcagcct gcttttttgt acaaagttgg 3000
cattataaaa aagcattgct catcaatttg ttgcaacgaa caggtcacta tcagtcaaaa 3060
taaaatcatt atttggggcc cgagcttaag actggccgtc gttttacaac gtcgtgactg 3120
ggaaaacatc catgctagcg ttaacgcgag agtagggaac tgccaggcat caaataaaac 3180
gaaaggctca gtcggaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 3240
tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgtgaagcaa cggcccggag 3300
ggtggcgggc aggacgcccg ccataaactg ccaggcatca aactaagcag aaggccatcc 3360
tgacggatgg cctttttgcg tttctacaaa ctcttcctgg ctagcggtac gcgtattaat 3420
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 3480
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 3540
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 3600
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 3660
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 3720
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3780
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3840
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3900
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3960
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4020
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4080
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4140
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4200
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4260
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4320
gtctgacgct cagtggaacg acgcgtaact cacgttaagg gattttggtc atgagcttgc 4380
gccgtcccgt caagtcagcg taatgctctg ccagtgttac aaccaattaa ccaattctga 4440
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 4500
accatatt 4508
<210> 3
<211> 3553
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggcccga gttaacgcta ccatggagct ccaaataatg 600
attttatttt gactgatagt gacctgttcg ttgcaacaaa ttgataagca atgctttttt 660
ataatgccaa ctttgtatag aaaagttggc tccgaatttc tcgaggaatt ccaattgacc 720
atgaccggtt tgtcgagcgt ctcagtcgac aagcttccct tcaccgaggg cctatttccc 780
atgattcctt catatttgca tatacgatac aaggctgtta gagagataat tggaattaat 840
ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt 900
gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact 960
tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa caccgtgaga 1020
ccggatccgc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 1080
cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 1140
ggaaacagct atgaccatga ttacgccaag cgcgcaatta accctcacta aagggaacaa 1200
aagctggagg acctcgaggg ggggcccggt acccaattcg ccctatagtg agtcgtatta 1260
cgcgcgctca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 1320
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 1380
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggtaag tcgacggtct 1440
cagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1500
gtggcaccga gtcggtgctt ttttactggt gagacgacta gttaagggcc cggcgcgcct 1560
aaggtacccc cgggtaactg atcataattc gacccaagtt tgtacaaaaa agttgaacga 1620
gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa aaaacagact 1680
acataatact gtaaaacaca acatatgcag tcactatgaa ccaactactt agatggtatt 1740
agtgacctgt agaattaatt cgagctctag agctgcaggg cggccgcgat atcccctata 1800
gtgagtcgta ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc 1860
tctgatgtta cattgcacaa gataaaaata tatcatcatg aacaataaaa ctgtctgctt 1920
acataaacag taatacaagg ggtgttatga gccatattca acgggaaacg tcgaggccgc 1980
gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg 2040
ggcaatcagg tgcgacaatc tatcgcttgt atgggaagcc cgatgcgcca gagttgtttc 2100
tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact 2160
ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg 2220
catggttact caccactgcg atccccggaa aaacagcatt ccaggtatta gaagaatatc 2280
ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga 2340
ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat 2400
cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc 2460
ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg 2520
tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt 2580
gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga 2640
actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg 2700
ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaatcag 2760
aattggttaa ttggttgtaa cactggcaga gcattacgct gacttgacgg gacggcgcaa 2820
gctcatgacc aaaatccctt aacgtgagtt acgcgtcgtt ccactgagcg tcagaccccg 2880
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2940
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3000
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 3060
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3120
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3180
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3240
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3300
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3360
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 3420
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 3480
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 3540
ttgctcacat gtt 3553
<210> 4
<211> 3603
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggcccga gttaacgcta ccatggagct ccaaataatg 600
attttatttt gactgatagt gacctgttcg ttgcaacaaa ttgataagca atgctttttt 660
ataatgccaa ctttgtatag aaaagttggc tccgaatttc tcgaggaatt ccaattgacc 720
atgaccggtt tgtcgagcgt ctcactggta ggactcacat atgctgcagt atttagcatg 780
ccccacccat ctgcaaggca ttctggatag tgtcaaaaca gccggaaatc aagtccgttt 840
atctcaaact ttagcatttt gggaataaat gatatttgct atgctggtta aattagattt 900
tagttaaatt tcctgctgaa gctctagtac gataagtaac ttgacctaag tgtaaagttg 960
agatttcctt caggtttata tagcttgtgc gccgcctggg tacaccgtga gaccggatcc 1020
gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 1080
gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 1140
ctatgaccat gattacgcca agcgcgcaat taaccctcac taaagggaac aaaagctgga 1200
ggacctcgag ggggggcccg gtacccaatt cgccctatag tgagtcgtat tacgcgcgct 1260
cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc 1320
gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc 1380
gcccttccca acagttgcgc agcctgaatg gcgaatggta agtcgacggt ctcagtttta 1440
gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc 1500
gagtcggtgc tttttttaaa gaattctcga cctcgagaca aatgcagtac cgtattaccg 1560
ccatgcatta gttattaatg ctgagacgac tagttagggc ccggcgccgc ctacgtaccc 1620
cgggtaactg atcataattc gacccaagtt tgtacaaaaa agttgaacga gaaacgtaaa 1680
atgatataaa tatcaatata ttaaattaga ttttgcataa aaaacagact acataatact 1740
gtaaaacaca acatatgcag tcactatgaa ccaactactt agatggtatt agtgacctgt 1800
agaattaatt cgagctctag agctgcaggg cggccgcgat atcccctata gtgagtcgta 1860
ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta 1920
cattgcacaa gataaaaata tatcatcatg aacaataaaa ctgtctgctt acataaacag 1980
taatacaagg ggtgttatga gccatattca acgggaaacg tcgaggccgc gattaaattc 2040
caacatggat gctgatttat atgggtataa atgggctcgc gataatgtcg ggcaatcagg 2100
tgcgacaatc tatcgcttgt atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg 2160
caaaggtagc gttgccaatg atgttacaga tgagatggtc agactaaact ggctgacgga 2220
atttatgcct cttccgacca tcaagcattt tatccgtact cctgatgatg catggttact 2280
caccactgcg atccccggaa aaacagcatt ccaggtatta gaagaatatc ctgattcagg 2340
tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg 2400
taattgtcct tttaacagcg atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa 2460
taacggtttg gttgatgcga gtgattttga tgacgagcgt aatggctggc ctgttgaaca 2520
agtctggaaa gaaatgcata aacttttgcc attctcaccg gattcagtcg tcactcatgg 2580
tgatttctca cttgataacc ttatttttga cgaggggaaa ttaataggtt gtattgatgt 2640
tggacgagtc ggaatcgcag accgatacca ggatcttgcc atcctatgga actgcctcgg 2700
tgagttttct ccttcattac agaaacggct ttttcaaaaa tatggtattg ataatcctga 2760
tatgaataaa ttgcagtttc atttgatgct cgatgagttt ttctaatcag aattggttaa 2820
ttggttgtaa cactggcaga gcattacgct gacttgacgg gacggcgcaa gctcatgacc 2880
aaaatccctt aacgtgagtt acgcgtcgtt ccactgagcg tcagaccccg tagaaaagat 2940
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 3000
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 3060
ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 3120
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 3180
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 3240
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 3300
ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 3360
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 3420
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 3480
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 3540
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 3600
gtt 3603
<210> 5
<211> 11300
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
caaaggatag agataaaaga caccaaggaa gctttagaca agatagagga agagcaaaac 60
aaaagtaaga ccaccgcaca gcaagcggcc gctgatcttc agacctggag gaggagatat 120
gagggacaat tggagaagtg aattatataa atataaagta gtaaaaattg aaccattagg 180
agtagcaccc accaaggcaa agagaagagt ggtgcagaga gaaaaaagag cagtgggaat 240
aggagctttg ttccttgggt tcttgggagc agcaggaagc actatgggcg cagcgtcaat 300
gacgctgacg gtacaggcca gacaattatt gtctggtata gtgcagcagc agaacaattt 360
gctgagggct attgaggcgc aacagcatct gttgcaactc acagtctggg gcatcaagca 420
gctccaggca agaatcctgg ctgtggaaag atacctaaag gatcaacagc tcctggggat 480
ttggggttgc tctggaaaac tcatttgcac cactgctgtg ccttggaatg ctagttggag 540
taataaatct ctggaacaga tttggaatca cacgacctgg atggagtggg acagagaaat 600
taacaattac acaagcttaa tacactcctt aattgaagaa tcgcaaaacc agcaagaaaa 660
gaatgaacaa gaattattgg aattagataa atgggcaagt ttgtggaatt ggtttaacat 720
aacaaattgg ctgtggtata taaaattatt cataatgata gtaggaggct tggtaggttt 780
aagaatagtt tttgctgtac tttctatagt gaatagagtt aggcagggat attcaccatt 840
atcgtttcag acccacctcc caaccccgag gggacccgac aggcccgaag gaatagaaga 900
agaaggtgga gagagagaca gagacagatc cattcgatta gtgaacggat cggcactgcg 960
tgcgccaatt ctgcagacaa atggcagtat tcatccacaa ttttaaaaga aaagggggga 1020
ttggggggta cagtgcaggg gaaagaatag tagacataat agcaacagac atacaaacta 1080
aagaattaca aaaacaaatt acaaaaattc aaaattttcg ggtttattac agggacagca 1140
gagatccagt ttggttaatt aacaactttg tatagaaaag ttggctccga atttctcgac 1200
gtcgtgagac gggatccgcg caacgcaatt aatgtgagtt agctcactca ttaggcaccc 1260
caggctttac actttatgct tccggctcgt atgttgtgtg gaattgtgag cggataacaa 1320
tttcacacag gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa 1380
agggaacaaa agctggagga cctcgagggg gggcccggta cccaattcgc cctatagtga 1440
gtcgtattac gcgcgctcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 1500
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 1560
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggtaagt 1620
cgaccgtctc aatgcaattc gcccttatta attggctccg gtgcccgtca gtgggcagag 1680
cgcacatcgc ccacagtccc cgagaagttg tggggagggg tcggcaattg aaccggtgcc 1740
tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt 1800
cccgagggtg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc 1860
aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc 1920
tttacgggtt atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt 1980
cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga 2040
gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga 2100
atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat 2160
ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa 2220
gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc 2280
cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg 2340
tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg tatcgccccg 2400
ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt 2460
cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt 2520
gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc 2580
acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg 2640
tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag 2700
actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag 2760
tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt 2820
caggtctagt taagggcccg gcgcgcctaa ggtacccccg ggtaactgat cataattcga 2880
cccaagtttg tacaaaaaag caggctgatt accggtcgcc accatggtga gcaagggcga 2940
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 3000
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 3060
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccttcgg 3120
ctacggcctg cagtgcttcg cccgctaccc cgaccacatg aagcagcacg acttcttcaa 3180
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 3240
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 3300
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 3360
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 3420
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 3480
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gctaccagtc 3540
caagctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 3600
cgccgccggg atcactctcg gcatggacga gctgtacaag ggatctggcg ccaccaactt 3660
ctctctgctg aagcaggccg gcgacgtgga ggagaaccca ggcccagcta gcatgaccga 3720
gtacaagccc acggtgcgcc tcgccacccg cgacgacgtc ccccgggccg tacgcaccct 3780
cgccgccgcg ttcgccgact accccgccac gcgccacacc gtcgacccgg accgccacat 3840
cgagcgggtc accgagctgc aagaactctt cctcacgcgc gtcgggctcg acatcggcaa 3900
ggtgtgggtc gcggacgacg gcgccgcggt ggcggtctgg accacgccgg agagcgtcga 3960
agcgggggcg gtgttcgccg agatcggccc gcgcatggcc gagttgagcg gttcccggct 4020
ggccgcgcag caacagatgg aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg 4080
gttcctggcc accgtcggcg tgtcgcccga ccaccagggc aagggtctgg gcagcgccgt 4140
cgtgctcccc ggagtggagg cggccgagcg cgccggggtg cccgccttcc tggaaacctc 4200
cgcgccccgc aacctcccct tctacgagcg gctcggcttc accgtcaccg ccgacgtcga 4260
ggtgcccgaa ggaccgcgca cctggtgcat gacccgcaag cccggtgcct gagcggccgc 4320
tatcgatcgt ttgatcctag ataactgatc tacccagctt tcttgtacaa agtggtgaat 4380
tccggcaatt cgatatcaag cttatcgata atcaacctct ggattacaaa atttgtgaaa 4440
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 4500
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 4560
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 4620
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 4680
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 4740
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 4800
ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 4860
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 4920
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 4980
tttgggccgc ctccccgcat cgataccgtc gacctcgagt cctagaaaaa catggagcaa 5040
tcacaagtag caatacagca gctaccaatg ctgattgtgc ctggctagaa gcacaagagg 5100
aggaggaggt gggttttcca gtcacacctc aggtaccttt aagaccaatg acttacaagg 5160
cagctgtaga tcttagccac tttttaaaag aaaagggggg actggaaggg ctaattcact 5220
cccaacgaag acaagatatc cttgatctgt ggatctacca cacacaaggc tacttccctg 5280
attggcagaa ctacacacca gggccaggga tcagatatcc actgaccttt ggatggtgct 5340
acaagctagt accagttgag caagagaagg tagaagaagc caatgaagga gagaacaccc 5400
gcttgttaca ccctgtgagc ctgcatggga tggatgaccc ggagagagaa gtattagagt 5460
ggaggtttga cagccgccta gcatttcatc acatggcccg agagctgcat ccggactgta 5520
ctgggtgtct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 5580
cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt 5640
tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta 5700
gcagggcccg tttaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 5760
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 5820
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 5880
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 5940
gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 6000
ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 6060
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 6120
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 6180
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 6240
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 6300
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 6360
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 6420
tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 6480
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 6540
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 6600
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 6660
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 6720
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 6780
tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca attaatcatc 6840
ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagtt 6900
gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac 6960
cgaccggctc gggttctccc gggacttcgt ggaggacgac ttcgccggtg tggtccggga 7020
cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca acaccctggc 7080
ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag tggtcggagg tcgtgtccac 7140
gaacttccgg gacgcctccg ggccggccat gaccgagatc ggcgagcagc cgtgggggcg 7200
ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga 7260
ctgacacgtg ctacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 7320
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7380
cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7440
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7500
catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 7560
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 7620
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7680
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7740
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 7800
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7860
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7920
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 7980
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8040
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8100
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8160
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8220
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8280
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8340
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8400
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8460
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8520
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8580
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga ccagccagga 8640
cagaaatgcc tcgacttcgc tgctacccaa ggttgccggg tgacgcacac cgtggaaacg 8700
gatgaaggca cgaacccagt ggacataagc ctgttcggtt cgtaagctgt aatgcaagta 8760
gcgtatgcgc tcacgcaact ggtccagaac cttgaccgaa cgcagcggtg gtaacggcgc 8820
agtggcggtt ttcatggctt gttatgactg tttttttggg gtacagtcta tgcctcgggc 8880
atccaagcag caagcgcgtt acgccgtggg tcgatgtttg atgttatgga gcagcaacga 8940
tgttacgcag cagggcagtc gccctaaaac aaagttaaac attatgaggg aagcggtgat 9000
cgccgaagta tcgactcaac tatcagaggt agttggcgtc atcgagcgcc atctcgaacc 9060
gacgttgctg gccgtacatt tgtacggctc cgcagtggat ggcggcctga agccacacag 9120
tgatattgat ttgctggtta cggtgaccgt aaggcttgat gaaacaacgc ggcgagcttt 9180
gatcaacgac cttttggaaa cttcggcttc ccctggagag agcgagattc tccgcgctgt 9240
agaagtcacc attgttgtgc acgacgacat cattccgtgg cgttatccag ctaagcgcga 9300
actgcaattt ggagaatggc agcgcaatga cattcttgca ggtatcttcg agccagccac 9360
gatcgacatt gatctggcta tcttgctgac aaaagcaaga gaacatagcg ttgccttggt 9420
aggtccagcg gcggaggaac tctttgatcc ggttcctgaa caggatctat ttgaggcgct 9480
aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg gctggcgatg agcgaaatgt 9540
agtgcttacg ttgtcccgca tttggtacag cgcagtaacc ggcaaaatcg cgccgaagga 9600
tgtcgctgcc gactgggcaa tggagcgcct gccggcccag tatcagcccg tcatacttga 9660
agctagacag gcttatcttg gacaagaaga agatcgcttg gcctcgcgcg cagatcagtt 9720
ggaagaattt gtccactacg tgaaaggcga gatcaccaag gtagtcggca aataatcatg 9780
agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 9840
ccccgaaaag tgccacctga cgtcgacgga tcgggagatc tcccgatccc ctatggtgca 9900
ctctcagtac aatctgctct gatgccgcat agttaagcca gtatctgctc cctgcttgtg 9960
tgttggaggt cgctgagtag tgcgcgagca aaatttaagc tacaacaagg caaggcttga 10020
ccgacaattg catgaagaat ctgcttaggg ttaggcgttt tgcgctgctt cgcgatgtac 10080
gggccagata tacgcgttga cattgattat tgactagtta ttaatagtaa tcaattacgg 10140
ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg gtaaatggcc 10200
cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 10260
tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 10320
cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 10380
acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 10440
ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 10500
tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 10560
tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 10620
ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagcg 10680
cgttttgcct gtactgggtg tctctggtta gaccagatct gagcctggga gctctctggc 10740
taactaggga acccactgct taagcctcaa taaagcttgc cttgagtgct tcaagtagtg 10800
tgtgcccgtc tgttgtgtga ctctggtaac tagagatccc tcagaccctt ttagtcagtg 10860
tggaaaatct ctagcagtgg cgcccgaaca gggacttgaa agcgaaaggg aaaccagagg 10920
agctctctcg acgcaggact cggcttgctg aagcgcgcac ggcaagaggc gaggggcggc 10980
gactggtgag tacgccaaaa attttgacta gcggaggcta gaaggagaga gatgggtgcg 11040
agagcgtcag tattaagcgg gggagaatta gatcgcgatg ggaaaaaatt cggttaaggc 11100
cagggggaaa gaaaaaatat aaattaaaac atatagtatg ggcaagcagg gagctagaac 11160
gattcgcagt taatcctggc ctgttagaaa catcagaagg ctgtagacaa atactgggac 11220
agctacaacc atcccttcag acaggatcag aagaacttag atcattatat aatacagtag 11280
caaccctcta ttgtgtgcat 11300
<210> 6
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
tggtgatagg taaggatggc ggtctcaacc ggagaagctg cagcgcatca gtttagagac 60
gtctagacgt ctcatctagc tgaaccgtct gcggaaccgt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 7
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
tggtgatagg taaggatggc ggtctcaacc gccaggaacc cttaagaaaa gtttagagac 60
gtctagacgt ctcatctagt ttggcatcat ctgcatgggt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 8
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
tggtgatagg taaggatggc ggtctcaacc gtaggggtta gaagccgccg gtttagagac 60
gtctagacgt ctcatctaga gtacagcaga ctctgcgggt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 9
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
tggtgatagg taaggatggc ggtctcaacc ggtagaagag ggagtccgcg gtttagagac 60
gtctagacgt ctcatctagc aatcttcctt cgggtggcgt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 10
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
tggtgatagg taaggatggc ggtctcaacc gctaagtttc ttgatgcttc gtttagagac 60
gtctagacgt ctcatctaga ccctgctact gaagatccgt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 11
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
tggtgatagg taaggatggc ggtctcaacc gcagcggcag ggattgagaa gtttagagac 60
gtctagacgt ctcatctagg accagactgt tctcttatgt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 12
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
tggtgatagg taaggatggc ggtctcaacc gcaaagcacg ttccttgtta gtttagagac 60
gtctagacgt ctcatctagt caaccgcttt agtgtcaagt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 13
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
tggtgatagg taaggatggc ggtctcaacc gacctgctct tccaagccct gtttagagac 60
gtctagacgt ctcatctagt catagataac tggatacagt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 14
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
tggtgatagg taaggatggc ggtctcaacc gaaggatctg gtctcatctt gtttagagac 60
gtctagacgt ctcatctaga gttcaatgtc acttctgagt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 15
<211> 129
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
tggtgatagg taaggatggc ggtctcaacc gcatcatcat cagcgacggc gtttagagac 60
gtctagacgt ctcatctagt ggctgtggag cgaacttggt ttggagaccc ggctcagtat 120
tgcgattac 129
<210> 16
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
accgccagca gcactacgag gca 23
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
aaactgcctc gtagtgctgc tgg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
accgaaagag caagtgtcct cct 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
aaacaggagg acacttgctc ttt 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
accgaatcag gtcactattc aat 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
aaacattgaa tagtgacctg att 23

Claims (7)

1.一种构建双sgRNA表达载体的方法,包括:
(a1)利用golden gate拼装方法,采用IIs型限制性内切酶A、IIs型限制性内切酶E、IIs型限制性内切酶D和IIs型限制性内切酶F将DNA片段与出发载体1进行拼装,得到重组载体1;
所述DNA片段的序列自上游到下游依次含有:所述IIs型限制性内切酶A的识别序列、名称为sgRNA1的sgRNA的间隔RNA的编码序列、IIs型限制性内切酶B的识别序列、IIs型限制性内切酶C的识别序列、名称为sgRNA2的sgRNA的间隔RNA的编码序列、所述IIs型限制性内切酶D的识别序列;
所述出发载体1的序列自上游到下游依次含有启动子1序列、所述IIs型限制性内切酶E的识别序列、筛选标签1的编码序列、所述IIs型限制性内切酶F的识别序列、sgRNA骨架1编码序列;
所述DNA片段与所述出发载体1中,所述IIs型限制性内切酶A切割产生的粘性末端overhang与所述IIs型限制性内切酶E切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶D切割产生的粘性末端overhang与所述IIs型限制性内切酶F切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶A切割产生的粘性末端overhang和所述IIs型限制性内切酶E切割产生的粘性末端overhang均不与所述IIs型限制性内切酶D切割产生的粘性末端overhang和所述IIs型限制性内切酶F切割产生的粘性末端overhang互补配对;
(a2)利用golden gate拼装方法,采用IIs型限制性内切酶G、所述IIs型限制性内切酶B、IIs型限制性内切酶H和所述IIs型限制性内切酶C将所述重组载体1与出发载体2进行拼装,得到重组载体2,所述重组载体2即为所述双sgRNA表达载体;
所述出发载体2的序列自上游到下游依次含有:所述IIs型限制性内切酶G的识别序列、sgRNA骨架2编码序列、筛选标签2的编码序列、启动子2序列、所述IIs型限制性内切酶H的识别序列;
所述重组载体1与所述出发载体2中,所述IIs型限制性内切酶G切割产生的粘性末端overhang与所述IIs型限制性内切酶B切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶H切割产生的粘性末端overhang与所述IIs型限制性内切酶C切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶G切割产生的粘性末端overhang和所述IIs型限制性内切酶B切割产生的粘性末端overhang均不与所述IIs型限制性内切酶H切割产生的粘性末端overhang和所述IIs型限制性内切酶C切割产生的粘性末端overhang互补配对;
所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F均不同于所述IIs型限制性内切酶B和所述IIs型限制性内切酶C;
所述sgRNA骨架1和所述sgRNA骨架2均含有完整sgRNA中除间隔RNA外的功能片段;
所述IIs型限制性内切酶A、所述IIs型限制性内切酶D、所述IIs型限制性内切酶E和所述IIs型限制性内切酶F均为BsaI;
所述IIs型限制性内切酶B、所述IIs型限制性内切酶C、所述IIs型限制性内切酶G和所述IIs型限制性内切酶H均为Esp3I;
所述启动子1为U6启动子;
所述启动子2为H1启动子;
所述筛选标签1为lacZ;
所述筛选标签2为Amp抗性筛选标签;
所述sgRNA骨架2编码序列为序列2的第1278-1360位。
2.一种构建双随机sgRNA表达载体文库的方法,包括:
(c1)利用golden gate拼装方法,将DNA片段库中的DNA片段与出发载体3进行拼装,得到重组载体库3;利用golden gate拼装方法,将所述DNA片段库中的DNA片段与出发载体4进行拼装,得到重组载体库4;
所述DNA片段库中的每种DNA片段均编码一种sgRNA的间隔RNA,所述DNA片段库中的每种DNA片段具有以下c11)或c12)的特征:
c11)所述DNA片段库中的每种DNA片段的两端分别各含有一个粘性末端,将上游粘性末端overhang命名为粘性末端overhang1,将下游粘性末端overhang2;
c12)下述c12a)或c12b):
c12a)所述DNA片段库中的每个DNA片段自上游到下游均依次含有IIs型限制性内切酶N1的识别序列、sgRNA的间隔RNA的编码序列、IIs型限制性内切酶N2的识别序列;
c12b)所述DNA片段库中的每个DNA片段自上游到下游均依次含有IIs型限制性内切酶N3的识别序列、sgRNA的间隔RNA的编码序列、IIs型限制性内切酶N4的识别序列;
所述出发载体3自上游到下游依次含有IIs型限制性内切酶M1的识别序列、启动子3序列、IIs型限制性内切酶M2的识别序列、筛选标签3的编码序列、IIs型限制性内切酶M3的识别序列、sgRNA骨架3编码序列、IIs型限制性内切酶M4的识别序列;所述IIs型限制性内切酶M1和所述IIs型限制性内切酶M4均不同于所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3;
所述出发载体4自上游到下游依次含有IIs型限制性内切酶M5的识别序列、启动子4序列、IIs型限制性内切酶M6的识别序列、筛选标签4的编码序列、IIs型限制性内切酶M7的识别序列、sgRNA骨架4编码序列、IIs型限制性内切酶M8的识别序列;所述IIs型限制性内切酶M5和所述IIs型限制性内切酶M8均不同于所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7;
所述出发载体3中,所述IIs型限制性内切酶M2切割产生的粘性末端overhang不与所述IIs型限制性内切酶M3切割产生的粘性末端overhang互补配对;所述出发载体4中,所述IIs型限制性内切酶M6切割产生的粘性末端overhang不与所述IIs型限制性内切酶M7切割产生的粘性末端overhang互补配对;
所述粘性末端overhang1与所述出发载体3中所述IIs型限制性内切酶M2切割产生的粘性末端overhang及所述出发载体4中所述IIs型限制性内切酶M6切割产生的粘性末端overhang均互补配对;所述粘性末端overhang2与所述出发载体3中所述IIs型限制性内切酶M3切割产生的粘性末端overhang及所述出发载体4中所述IIs型限制性内切酶M7切割产生的粘性末端overhang均互补配对;
所述DNA片段库中DNA片段中所述IIs型限制性内切酶N1切割产生的粘性末端overhang与所述出发载体3中所述IIs型限制性内切酶M2切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N2切割产生的粘性末端overhang与所述出发载体3中所述IIs型限制性内切酶M3切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N3切割产生的粘性末端overhang与所述出发载体4中所述IIs型限制性内切酶M6切割产生的粘性末端overhang互补配对;所述DNA片段库中DNA片段中所述IIs型限制性内切酶N4切割产生的粘性末端overhang与所述出发载体4中所述IIs型限制性内切酶M7切割产生的粘性末端overhang互补配对;
所述DNA片段库中的每种DNA片段满足c11)所述特征,采用所述IIs型限制性内切酶M2和所述IIs型限制性内切酶M3将所述DNA片段库中的DNA片段与所述出发载体3进行拼装,采用所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7将所述DNA片段库中的DNA片段与所述出发载体4进行拼装;
所述DNA片段库中的每种DNA片段满足c12)所述特征,采用所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶N1和所述IIs型限制性内切酶N2将所述DNA片段库中的DNA片段与所述出发载体3进行拼装,采用所述IIs型限制性内切酶M6、所述IIs型限制性内切酶M7、所述IIs型限制性内切酶N3和所述IIs型限制性内切酶N4将所述DNA片段库中的DNA片段与所述出发载体4进行拼装;
(c2)利用golden gate拼装方法,采用所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、IIs型限制性内切酶M7和IIs型限制性内切酶M8将重组载体库3中的重组载体、重组载体库4中的重组载体与出发载体5进行拼装,得到重组载体库5,所述重组载体库5即为所述双随机sgRNA表达载体文库;
所述出发载体5的序列自上游到下游依次含有所述IIs型限制性内切酶M9的识别序列、筛选标签5的编码序列、所述IIs型限制性内切酶M10的识别序列;
所述出发载体3、所述出发载体4和所述出发载体5中满足y1)、y2)和y3)以及x1)-x8)中的任一种:
y1)所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对;
y2)所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对;
y3)所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x1)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x2)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x3)所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x4)所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x5)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x6)所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M5切割产生的粘性末端overhang不与所述IIs型限制性内切酶M1切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
x7)所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M9切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang不与所述IIs型限制性内切酶M4切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对;
x8)所述IIs型限制性内切酶M4切割产生的粘性末端overhang与所述IIs型限制性内切酶M10切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M8切割产生的粘性末端overhang与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;所述IIs型限制性内切酶M10切割产生的粘性末端overhang不与所述IIs型限制性内切酶M5切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M4切割产生的粘性末端overhang不与所述IIs型限制性内切酶M8切割产生的粘性末端overhang互补配对,所述IIs型限制性内切酶M1切割产生的粘性末端overhang不与所述IIs型限制性内切酶M9切割产生的粘性末端overhang互补配对;
所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶N1和所述IIs型限制性内切酶N2均不同于所述IIs型限制性内切酶M1和所述IIs型限制性内切酶M4;
所述IIs型限制性内切酶M6、所述IIs型限制性内切酶M7、所述IIs型限制性内切酶N3和所述IIs型限制性内切酶N4均不同于所述IIs型限制性内切酶M5和所述IIs型限制性内切酶M8。
3.根据权利要求2所述的方法,其特征在于:
所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7均相同;
和/或,所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10均相同;
和/或,所述sgRNA骨架3和所述sgRNA骨架4均为含有完整sgRNA中除间隔RNA外的功能片段。
4.根据权利要求2或3所述的方法,其特征在于:
所述IIs型限制性内切酶M2、所述IIs型限制性内切酶M3、所述IIs型限制性内切酶M6和所述IIs型限制性内切酶M7均为BsaI;
和/或,所述IIs型限制性内切酶M1、所述IIs型限制性内切酶M4、所述IIs型限制性内切酶M5、所述IIs型限制性内切酶M8、所述IIs型限制性内切酶M9和所述IIs型限制性内切酶M10均为Esp3I;
和/或,所述启动子3为U6启动子;
和/或,所述启动子4为7Sk启动子;
和/或,所述筛选标签3为lacZ;
和/或,所述筛选标签4为lacZ;
和/或,所述sgRNA骨架3编码序列为序列3的第1443-1524位;
和/或,所述sgRNA骨架4编码序列为序列4的第1435-1517位。
5.根据权利要求1或2所述方法,其特征在于:所述出发载体1的序列为序列表中序列1;
所述出发载体2的序列为序列表中序列2;
所述出发载体3的序列为序列表中序列3;
所述出发载体4的序列为序列表中序列4;
所述出发载体5的序列为序列表中序列5。
6.一种构建双sgRNA表达质粒的方法,包括如下步骤:
(a1)合成用于表达sgRNA1和sgRNA2的DNA 片段,所述DNA片段自上游到下游依次含有IIs型限制性内切酶A的识别序列、用于表达所述sgRNA1上的间隔序列的DNA序列、IIs型限制性内切酶B的识别序列、用于表达所述sgRNA2上的间隔序列的DNA序列、IIs型限制性内切酶A的识别序列;
(a2)选择符合如下条件的空载sgRNA 骨架载体作为出发质粒1:自上游到下游依次含有启动子1、所述IIs型限制性内切酶A的识别序列、筛选标签序列1、所述IIs型限制性内切酶A的识别序列、sgRNA骨架序列1;
(a3)基于golden gate拼装技术,采用所述IIs型限制性内切酶A将所述DNA片段克隆到所述出发质粒1中,得到重组质粒1;
(a4)选择符合如下条件的空载sgRNA 骨架载体作为出发质粒2:自上游到下游依次含有所述IIs型限制性内切酶B的识别序列、sgRNA骨架序列2、筛选标签序列2、启动子2、所述IIs型限制性内切酶B的识别序列;
(a5)基于golden gate拼装技术,采用所述IIs型限制性内切酶B将所述重组质粒1与所述出发质粒2进行重组,得到能够同时表达所述sgRNA1和所述sgRNA2的重组质粒2,所述重组质粒2即为所述双sgRNA表达质粒。
7.一种构建双sgRNA表达质粒的方法,包括如下步骤:
(b1)合成用于表达sgRNA1和sgRNA2的DNA 片段,所述DNA片段自上游到下游依次含有IIs型限制性内切酶A的识别序列、用于表达所述sgRNA1上的间隔序列的DNA序列、IIs型限制性内切酶B的识别序列、用于表达所述sgRNA2上的间隔序列的DNA序列、IIs型限制性内切酶A的识别序列;
(b2)选择符合如下条件的空载sgRNA 骨架载体作为出发质粒1:自上游到下游依次含有启动子1、所述IIs型限制性内切酶A的识别序列、筛选标签序列1、所述IIs型限制性内切酶A的识别序列、sgRNA骨架序列1;
(b3)基于golden gate拼装技术,采用所述IIs型限制性内切酶A将所述DNA片段克隆到所述出发质粒1中,得到重组质粒1;
(b4)选择符合如下条件的空载sgRNA 骨架载体作为出发质粒2:自上游到下游依次含有所述IIs型限制性内切酶B的识别序列、sgRNA骨架序列2、loxP序列、筛选标签序列2、loxP序列、启动子2、所述IIs型限制性内切酶B的识别序列;
(b5)基于golden gate拼装技术,采用所述IIs型限制性内切酶B将所述重组质粒1与所述出发质粒2进行重组,得到能够同时表达所述sgRNA1和所述sgRNA2且携带有“loxP序列-筛选标签序列2-loxP序列”的重组质粒2;
(b6)通过Cre/loxp位点重组将所述重组质粒2中的所述筛选标签序列2删除,得到重组质粒3,所述重组质粒3即为所述双sgRNA表达质粒。
CN201710262042.6A 2017-04-20 2017-04-20 双sgRNA表达质粒及其文库的构建方法 Expired - Fee Related CN107090466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710262042.6A CN107090466B (zh) 2017-04-20 2017-04-20 双sgRNA表达质粒及其文库的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710262042.6A CN107090466B (zh) 2017-04-20 2017-04-20 双sgRNA表达质粒及其文库的构建方法

Publications (2)

Publication Number Publication Date
CN107090466A CN107090466A (zh) 2017-08-25
CN107090466B true CN107090466B (zh) 2020-02-28

Family

ID=59638303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710262042.6A Expired - Fee Related CN107090466B (zh) 2017-04-20 2017-04-20 双sgRNA表达质粒及其文库的构建方法

Country Status (1)

Country Link
CN (1) CN107090466B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111278848B (zh) 2017-08-04 2023-06-27 北京大学 特异性识别甲基化修饰dna碱基的tale rvd及其应用
EP3666898A4 (en) 2017-08-08 2021-03-24 Peking University GENE INACTIVATION PROCESS
CN107893086B (zh) * 2017-10-24 2021-09-03 中国科学院武汉植物园 快速构建配对sgRNA的Cas9双元表达载体文库的方法
CN108205614A (zh) * 2017-12-29 2018-06-26 苏州金唯智生物科技有限公司 一种全基因组sgRNA文库的构建系统及其应用
CN110373430B (zh) * 2018-04-13 2021-02-19 青岛清原化合物有限公司 一种随机突变的基因编辑系统及其应用
CN110835635B (zh) * 2018-08-16 2024-01-09 深圳华大生命科学研究院 不同启动子启动多个串联sgRNA表达的质粒构建方法
CN113646434B (zh) * 2018-12-20 2023-05-30 北京大学 使用加标签的向导rna构建体进行高效基因筛选的组合物和方法
CN111349654B (zh) * 2018-12-20 2023-01-24 北京大学 使用加标签的向导rna构建体进行高效基因筛选的组合物和方法
CN112011562A (zh) * 2020-09-11 2020-12-01 苏州一兮生物科技有限公司 一种双gRNA-pTargetF质粒的构造方法
CN114107384A (zh) * 2021-11-29 2022-03-01 湖南亚大丰晖新材料有限公司 一种靶向人非小细胞肺癌细胞株中eml4-alk融合基因变体1的载体及应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811476A (zh) * 2015-11-27 2017-06-09 清华大学 一种用于多元蛋白复合物表达的成套载体及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10287590B2 (en) * 2014-02-12 2019-05-14 Dna2.0, Inc. Methods for generating libraries with co-varying regions of polynuleotides for genome modification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811476A (zh) * 2015-11-27 2017-06-09 清华大学 一种用于多元蛋白复合物表达的成套载体及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Robust CRISPR/Cas9 System for Convenient, High-Efficiency Multiplex Genome Editing in Monocot and Dicot Plants;Ma XL等;《MOLECULAR PLANT》;20150803;第8卷(第8期);第1274-1284页 *
EcoExpress-Highly Efficient Construction and Expression of Multicomponent Protein Complexes in Escherichia coli;Qin YR等;《ACS SYNTHETIC BIOLOGY》;20161130;第5卷(第11期);第1239-1246页 *
Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library;Zhu SY等;《NATURE BIOTECHNOLOGY》;20161031;第34卷(第12期);第1279-1287页 *
快速构建多重sgRNA载体利用CRISPR/Cas9技术敲除拟南芥IAA2基因;刘丁源等;《遗传》;20160831;第38卷(第8期);第756-764页 *

Also Published As

Publication number Publication date
CN107090466A (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
CN107090466B (zh) 双sgRNA表达质粒及其文库的构建方法
US20210060181A1 (en) Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
US7527966B2 (en) Gene regulation in transgenic animals using a transposon-based vector
KR20210149686A (ko) 유전자 편집에 유용한 폴리펩티드 및 사용 방법
US20240117335A1 (en) Fusion proteins for base editing
KR20150105635A (ko) 서열 조작을 위한 crispr-cas 성분 시스템, 방법 및 조성물
CN114835821B (zh) 一种高效特异实现碱基颠换的编辑系统、方法及用途
CN113717962B (zh) 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体
CN113692225B (zh) 经基因组编辑的鸟类
CN113831394A (zh) 一种非洲猪瘟病毒asfv基因的重组病毒组合及由其制备的疫苗
CN111315212B (zh) 经过基因组编辑的鸟
CN106755100A (zh) 可控性hiv‑1基因组靶向编辑系统和其靶向载运系统
KR102224580B1 (ko) 유전자 발현 및 억제가 동시에 가능한 핵산 구조체
PT1029069E (pt) Vectores de alfavírus
US20030157495A1 (en) Nucleic acid molecules encoding CEL I endonuclease and methods of use thereof
KR20110122434A (ko) 랄스토니아 속 미생물의 유전자를 불활성화시키는 방법
WO2001051626A2 (en) Novel plasmid expression vectors
THESS et al. Patent 2862476 Summary

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200228

CF01 Termination of patent right due to non-payment of annual fee