CN107312790A - 一种可编程的多位点特异性的转录抑制系统及其应用 - Google Patents

一种可编程的多位点特异性的转录抑制系统及其应用 Download PDF

Info

Publication number
CN107312790A
CN107312790A CN201710497198.2A CN201710497198A CN107312790A CN 107312790 A CN107312790 A CN 107312790A CN 201710497198 A CN201710497198 A CN 201710497198A CN 107312790 A CN107312790 A CN 107312790A
Authority
CN
China
Prior art keywords
sequence
lys
sgrna
leu
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710497198.2A
Other languages
English (en)
Inventor
苗晨思
赵会伟
关莹
陈泽华
娄春波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Institute of Microbiology of CAS
Original Assignee
University of Science and Technology of China USTC
Institute of Microbiology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC, Institute of Microbiology of CAS filed Critical University of Science and Technology of China USTC
Priority to CN201710497198.2A priority Critical patent/CN107312790A/zh
Publication of CN107312790A publication Critical patent/CN107312790A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种可编程的多位点特异性的转录抑制系统及其应用。本发明所提供的可编程的多位点特异性的转录抑制系统,包括如下A)和B):A)位点特异性转录抑制蛋白FndCpf1(D917A),或者能够表达所述FndCpf1(D917A)的DNA或RNA;B)由19‑36nt的重复序列以及可变的16‑31nt的间隔序列自5’端到3’端依次交替排列构成的靶向多个位点的可编程sgRNA,或者能够转录所述可编程sgRNA的DNA环状质粒或DNA线性片段。本发明获得了具有高效的、位点特异性的、且可同时靶向多个位点的基因转录调控工具。

Description

一种可编程的多位点特异性的转录抑制系统及其应用
技术领域
本发明属于生物技术领域,涉及一种可编程的多位点特异性的转录抑制系统及其应用。
背景技术
可编程的位点特异性的基因调控元件在全基因组层次的基因功能研究、代谢通路调控以及人工基因线路设计中均发挥重要作用。目前,研究人员已经开发了诸多可编程的基因调控元件,包括RNAi(RNA interference)、工程化的DNA结合蛋白(如锌指蛋白ZFP(zinc-finger protein)、转录激活样效应蛋白TALE(transcription-activator-likeeffector protein)和基于CRISPR-Cas系统的CRISPRi。其中RNAi介导的基因敲低技术特异性较低且受作用机体限制,而基于DNA结合蛋白的调控技术,比如锌指蛋白ZFP及转录激活样效应蛋白TALE,在对特定位点进行调控时,需要对蛋白质序列进行重新设计,且得到的蛋白不一定具有良好的特异性,因而限制了其广泛应用。目前以Ⅱ型CRISPR-Cas9系统为基础的CRISPRi技术应用最为广泛,该技术系统中包含一个dCas9及一个工程化的sgRNA,对基因的特定位点进行调控时,只需要改变sgRNA中20bp的序列,而不要对蛋白序列做任何改变。尽管如此,该系统也存在一定问题,如多位点调控时sgRNA表达问题。而近期报道的Ⅴ-A型CRISPR-Cpf1系统,与CRISPR-Cas9系统相比,具有明显优势。首先,Cpf1在天然状态下由单个RNA引导,而Cas9在天然状态下由两个RNA(tracrRNA-crRNA)引导;其次,Cpf1蛋白除具有DNA切割酶活性外,还具有加工自身前体RNA(pre-RNA)的RNA酶活性,而Cas9只具有DNA切割酶活性,加工自身前体RNA时需要RNaseⅢ的参与;再者,与CRISPR-Cas9系统相比,该系统还具有更低的脱靶率,是除CRISPR-Cas9之外非常具有前景的基因组工程技术。
发明内容
本发明的目的是提供一种可编程的多位点特异性的转录抑制系统及其应用。
本发明所提供的可编程的多位点特异性的转录抑制系统,可来自于CRISPR-Cpf1系统,具体可包括如下(A)和(B):
(A)位点特异性转录抑制蛋白,或者能够表达所述位点特异性转录抑制蛋白的DNA环状质粒或DNA线性片段或体外转录的RNA或mRNA;
所述位点特异性转录抑制蛋白为将来自于弗朗西斯菌(Francisella novicida)U112的Cpf1蛋白的第917位氨基酸由天冬氨酸突变为丙氨酸(D917A)后得到的蛋白;
(B)靶向多个位点的可编程sgRNA,或者能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段;
所述靶向多个位点的可编程sgRNA,由19-36nt的重复序列以及可变的16-31nt的间隔序列自5’端到3’端依次交替排列构成。
其中,所述间隔序列为与预进行转录抑制的目的基因的靶标序列相结合的序列。对特定位点进行基因调控时,只需要改变所述靶向多个位点的可编程sgRNA中的所述间隔序列。
更加具体的,所述转录抑制系统可为如下(a)或(b)或(c):
(a)由所述位点特异性转录抑制蛋白和所述靶向多个位点的可编程sgRNA组成;
(b)由既能够表达所述位点特异性转录抑制蛋白也能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段组成;
(c)由能够表达所述位点特异性转录抑制蛋白的DNA环状质粒或DNA线性片段或体外转录的RNA或mRNA,以及能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段组成。
进一步,在所述靶向多个位点的可编程sgRNA中,所述重复序列的长度最好为19nt。所述间隔序列的长度最好为18-20nt。
其中,所述重复序列为来自于弗朗西斯菌(Francisella novicida)U112的sgRNA的重复序列。
具体的,所述位点特异性转录抑制蛋白的氨基酸序列具体如序列表中序列1所示。所述靶向多个位点的可编程sgRNA中,所述重复序列为至少含有序列表中序列2自3’末端起的19个核苷酸,并且从序列2自3’末端起的第20个核苷酸起沿着序列2向5’端延长,得到的长度为19-36nt的单链RNA。
在本发明中,所述可编程的多位点特异性的转录抑制系统具体由能够表达所述位点特异性转录抑制蛋白的DNA环状质粒,以及能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒组成。其中,所述“能够表达所述位点特异性转录抑制蛋白的DNA环状质粒”为FndCpf1表达质粒,所述FndCpf1表达质粒的全序列如序列表中序列3所示。所述“能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒”是将FnsgRNA_BCB质粒两个酶切位点BsmbI之间的片段替换为能够转录所述靶向多个位点的可编程sgRNA对应的DNA序列后得到的重组质粒;所述FnsgRNA_BCB质粒的全序列如序列表中序列4所示。
所述转录抑制系统在抑制目的基因转录中的应用也属于本发明的保护范围。
利用所述转录抑制系统抑制所述目的基因转录的过程中,最好以所述目的基因中符合如下条件的序列作为PAM序列:3’末端的碱基为A或C或G,5’端富含碱基T的序列。
所述PAM序列的长度最好为4-6bp。进一步,所述PAM序列最好为5′-TTTTTV-3′、5′-TTTTV-3′或5′-TTTV-3′;其中,V为A或C或G。
另外,CRISPR-Cpf1系统在制备用于抑制靶标基因转录的系统中的应用也属于本发明的保护范围。其中,所述CRISPR-Cpf1系统中的Cpf1蛋白为将来自于弗朗西斯菌(Francisella novicida)U112的Cpf1蛋白的第917位氨基酸由天冬氨酸突变为丙氨酸后得到的蛋白。
本发明比较了Francisella novicida U112 Cpf1(FnCpf1)的三种DNase失活突变体,FnCpf1(D917A),FnCpf1(E1006A),FnCpf1(D917A,E1006A)作为位点特异性基因调控蛋白的作用,并选择较优的突变体D917A,优化了多位点sgRNA设计及PAM序列选择,最终获得了具有高效的、位点特异性的、且可同时靶向多个位点的基因转录调控工具。
附图说明
图1为三个质粒的组成示意图。A:FndCpf1表达质粒;B:报告质粒;C:sgRNA表达质粒;D:FnsgRNA_BCB示意图及作用于不同位点的sgRNA的构建方法。
图2为FndCpf1不同突变位点对抑制作用的影响。A:三种突变体在启动子区NTP1位置上的抑制作用曲线,其中Fnd1_NTP1、Fnd2_NTP1、Fnd12_NTP1分别对应D917A、E1006A、(D917A,E1006A)的突变体;阳性对照P,即不含有sgRNA,但含有FndCpf1及报告质粒的菌株;阴性对照N,即不含有报告质粒,但含有FndCpf1及sgRNA质粒的菌。该实验中IPTG的浓度为:0,7.8125,31.25,62.5,125,250,500,2000μM;(因为图为对数轴,横坐标无法显示0,所以图中横坐标1μM IPTG浓度下的荧光值实际对应0μM IPTG浓度下的数值);B:三种突变体在NTP1位点的抑制倍数,即IPTG浓度为0μM时的荧光值与IPTG浓度为2000μM时的比值,Fnd1(D917A)的抑制倍数约为85倍,Fnd2(E1006A)的抑制倍数约为47倍,Fnd12(D917A,E1006A)的抑制倍数约为17倍。
图3为sgRNA靶序列长度对FndCpf1抑制作用的影响。A:sgRNA作用于编码区模板链上,序列长度分别为14-25nt(逐个碱基增加)及27nt、29nt、31nt;B:FndCpf1在不同sgRNA靶序列长度下的抑制倍数(即IPTG浓度为0μM时的荧光值与IPTG浓度为100μM时的比值),其中长度为14、15nt时抑制倍数最低在10-20倍之间,大于15nt时,抑制倍数明显提高,在18、19、20nt时抑制倍数达到最高。
图4为sgRNA为T1时不同重复序列长度对其抑制作用的影响。A:sgRNA为T1,其中repeat序列长度变化示意图;B:T1中重复序列长度为16、18nt时,几乎无抑制作用,重复序列长度为19nt及大于19nt时,抑制倍数(即IPTG浓度为0μM时的荧光值与IPTG浓度为100μM时的比值)差异不大。
图5为FndCpf1同时作用于编码区多个位点的抑制作用。A:sgRNA T1、T12、T123的构建形式;B:FndCpf1在sgRNA为T1、T12、T123时的抑制作用曲线;C:FndCpf1在sgRNA为T1、T12、T123时的抑制倍数,分别约为67倍、119倍、283倍;该实验中IPTG的浓度为:0,7.8125,31.25,62.5,125,250,500,2000μM;抑制倍数,即IPTG浓度为0μM时的荧光值与IPTG浓度为2000μM时的比值。
图6为测试系统中的报告质粒设计。sgRNA靶向位点位于RiboJ及启动子之间,NNNNNN表示PAM序列。
图7为PAM序列富集方法流程图。
图8为FndCpf1在不同PAM序列下的抑制作用。FndCpf1在不同PAM序列下的抑制作用,横坐标为不同PAM序列的编码,对应的PAM序列见表5,纵坐标为不同PAM序列的菌株在20μM IPTG诱导下对应的荧光值。
图9为PAM序列3′位碱基偏好性分析。A:数据中PAM序列特征为5′-TTTTTN-3′的抑制作用比较,框内为最后一个碱基为T的PAM序列;B:数据中PAM序列特征为5′-TTTTN-3′的抑制作用比较;C:数据中PAM序列特征为5′-TTTN-3′的抑制作用比较;D:数据中PAM序列特征为5′-TTN-3′的抑制作用比较。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
(1)Luria-Bertani(LB)液体培养基:蛋白胨(Fisher Scientific)10g/L;NaCl(Fisher Scientific)10g/L;酵母粉(Fisher Scientific)5g/L。121℃高压灭菌20min。
(2)LB固体培养基:与LB液体培养基的配方相同,添加1.5%琼脂粉。
(3)补充有盐的M9基本培养基:Na2PO4(Sigma)6.8g/L;KH2PO4(Sigma)3g/L;NaCl(Sigma)0.5g/L;NH4Cl(Sigma)1g/L;MgSO4(Fisher Scientific)2mM;CaCl2(Sigma)100μM;葡萄糖(Sigma)0.4%;酪蛋白氨基酸(Acros)0.2%。
(4)氯霉素(Acros):溶于LB或M9培养基,终浓度20μg/ml。
(5)氨苄青霉素(Acros):溶于LB或M9培养基,终浓度25μg/ml。
(6)卡那霉素(Acros):溶于LB或M9培养基,终浓度50μg/ml。
(7)异丙基-β-D-1-硫代半乳糖苷(IPTG)(USB Corporation)储液浓度1M。
(8)PBS缓冲液:NaCl:7.9g(北京化工厂,纯度≥99.5%,pH:5.0~8.0);KCl:0.2g(北京化工厂,纯度≥99.5%,pH:5.0~8.0);KH2PO4:0.24g(北京化工厂,纯度≥99.5%,pH:4.2~4.5);K2HPO4:1.8g(北京化工厂,纯度≥99.0%,pH:8.9~9.4)。溶于800ml蒸馏水中,最后加蒸馏水定容至1L,用HCl(分析纯,国药集团化学试剂有限公司)调节溶液的pH值至7.4。
(9)补充有2mg/ml卡那霉素的PBS缓冲液。
质粒构建和菌株维持中使用LB液体和固体培养基。培养基中对菌株进行培养,诱导时使用补充有盐的M9基本培养基。
限制性内切酶、T4多核苷酸激酶和T4DNA连接酶购自New England Biolabs(Frankfurt,Germany)。普通引物合成服务由博迈德生物技术有限公司提供,N碱基随机引物合成服务由英潍捷基(上海)贸易有限公司提供。
实施例1、转录抑制测试系统的构建
本发明在大肠杆菌DH5α(TransGen Biotech)中,选用不同的质粒分别表达FndCpf1,sgRNA及荧光报告蛋白,sgRNA作用于荧光报告质粒的不同位点,利用报告蛋白的荧光强度表征转录抑制作用,即荧光强度越低,转录抑制作用越强,以此研究不同设计下的FndCpf1的转录抑制作用。
其中,FndCpf1表达质粒(全序列如序列表中序列3所示),启动子为pTac诱导型启动子,使用异丙基-β-D-硫代半乳糖苷(IPTG)作为诱导剂诱导表达,氨苄青霉素抗性,p15A复制子。sgRNA表达质粒,启动子为J23119组成型启动子,氯霉素抗性,ColE1复制子。报告质粒(全序列如序列表中序列5所示)使用sfgfp作为报告基因,启动子为J23100的组成型启动子,卡那霉素抗性,pSC101复制子。这三个质粒的结构示意图具体参见图1。
sgRNA表达质粒:是以FnsgRNA_BCB质粒(全序列如序列表中序列4所示)为基础,以Golden Gate反应方法根据作用序列不同分别构建的,构建不同靶点的sgRNA序列时,将靶序列设计在一对反向互补的引物内,同时留出与载体切口(BsmbI酶切后的切口)互补的粘性末端(图1中D)。在组装前,分别取浓度为10μM的两引物各5μL加入40μL的双蒸水中混合均匀,然后再取2μL的引物混合物进行磷酸化处理,磷酸化反应体系如下:引物对2μL;T4PNK 1μL;10×T4连接酶缓冲液2μL;双蒸水15μL。最后从磷酸化体系中取1μL产物与基础质粒FnsgRNA_BCB一起进行Golden Gate反应。Golden Gate程序设置及反应体系分别见表1和表2。
表1 Golden Gate程序设置
表2 Golden Gate反应体系
实施例2、FnCpf1不同DNase突变体的转录抑制作用比较
根据已有FnCpf1的遗传学突变研究报道,FnCpf1(D917A),FnCpf1(E1006A)单个氨基酸位点的突变均能使得FnCpf1完全丧失切割DNA活性。因而本发明设计了三种FnCpf1突变形式,分别为FnCpf1(D917A),FnCpf1(E1006A),FnCpf1(D917A,E1006A),靶位点选择报告基因的启动子区的非模板链,即NT链,sgRNA命名为NTP1,分别将三种FndCpf1的突变体的表达质粒与sgRNA NTP1表达质粒(按照实施例1方法构建,其中含有靶序列NTP1引物为F:agatgcactgtacctaggactgagctag;R:cttcctagctcagtcctaggtacagtgc)及报告质粒(即实施例1中的报告质粒)共转大肠杆菌DH5α,诱导剂IPTG浓度设置为:0,7.8125,31.25,62.5,125,250,500,2000μM,经过流式测试各组中报告蛋白的荧光强度。
实验同时设置阳性对照(P),即不含有sgRNA,但含有FndCpf1及报告质粒的菌株;阴性对照(N),即不含有报告质粒,但含有FndCpf1及sgRNA质粒的菌。。
用于表达FnCpf1(D917A)的质粒即为实施例1中的FndCpf1质粒。用于表达FnCpf1(E1006A)的质粒以实施例1中的FndCpf1表达质粒为模板,分别以F:atgtcaatttatcaagaatttgttaataaatatag和R:caaaatttaaatctgcaaaaaccacaatag;以及F:ctattgtggtttttgcagatttaaattttg和R:ctagttattcctattctgcacgaactca为引物,得到的两个片段经Gibson方法连接并测序验证正确后得到该质粒。用于表达FnCpf1(D917A,E1006A)同样以实施例1中的FndCpf1表达质粒为模板,分别以F:atgtcaatttatcaagaatttgttaataaatatag和R:cacctcttgctatacttaatatatgaac;F:gttcatatattaagtatagcaagaggtgaaagacatttag和R:caaaatttaaatctgcaaaaaccacaatag;以及F:ctattgtggtttttgcagatttaaattttg和R:ctagttattcctattctgcacgaactca为引物,得到的三个片段经Gibson方法连接并测序验证正确后得到该质粒。
流式细胞仪荧光定量检测方法,具体如下:
首先,在LB平板上选取单克隆的细菌,接种至Falcon管的4ml LB中,在37℃、250rpm的摇床中培养过夜。利用预热的M9培养基将过夜培养物1:200稀释至96孔板。在高速轨道振荡的Safire微板分光光度计(Tecan)中37℃孵育,每5min记录各孔的OD600测量值。一旦稀释培养物的OD600到达0.12-0.14(~3h),利用含有IPTG的预热的M9培养基,将培养物700倍稀释至新的96孔板。在数显恒温摇床(Elmi)中以1,000rpm诱导6小时,维持指数生长。最后,将各培养物转移至含有150μl PBS和2mg/ml卡那霉素的新板中,终止蛋白表达。
流式细胞仪电压参数设置:FSC:440,SSC:260,FITC:480。激发光波长为488nm,sfGFP的发射光波长为533/30nm。FSC阈值设为200,SSC阈值设为500,两者间关系设为AND。收集50000个事件。流式细胞仪测得的数据使用软件FlowJo(v7.6)分析处理,其中荧光值取算术平均值。
所有测试实验数据均为至少3次不同天次的平均值,数据由Excel 2010、GraphPadPrism 6进行处理并作图。
结果如图2所示,由图可见:三种突变体中Fnd1(D917A)的抑制作用倍数最高,约85倍,其次为Fnd12(D917A,E1006A),约47倍,最后是Fnd2(E1006A),约17倍(抑制倍数是指IPTG为零时的荧光值与IPTG为2000时的荧光值之间的比值,因为图对数轴,横坐标无法显示0,所以图中横坐标1μM IPTG浓度下的荧光值实际对应0μM IPTG浓度下的数值)。
因而后续实验中采用Fnd1作为研究对象,后文中出现的FndCpf1均为Fnd1,即FndCpf1(D917A)。
实施例3、sgRNA的构建中重复序列长度、间隔序列长度对转录抑制作用的影响
一、sgRNA靶序列长度变化
本发明的发明人在报告质粒(即实施例1中的报告质粒)中sfgfp基因的编码区上选择了一个位点,改变sgRNA中靶序列长度,探究其最短靶序列长度,该实验中序列长度设为14-25nt(逐个碱基增加)及27nt、29nt、31nt(图3中A)。
具体操作如下:各sgRNA相关质粒的构建方法见实施例1(图1中D),序列信息见表3。
表3 sgRNA中不同长度的靶序列信息
分别将FndCpf1的突变体的表达质粒与各sgRNA相关质粒及报告质粒(即实施例1中的报告质粒)共转大肠杆菌DH5α,诱导剂IPTG浓度设置为:100μM,经过流式测试各组中报告蛋白的荧光强度(具体方法参见实施例2)。
每组设置至少3个重复,结果以均值±标准差的形式表示。
结果如图3中B,不同靶序列长度下,FndCpf1的抑制倍数(指IPTG浓度为0μM时的荧光值与IPTG浓度为100μM时的比值)。由图可见:靶序列至少需要16nt,FndCpf1才能发挥明显的抑制作用。靶序列长度大于16nt时,抑制倍数有所差异,但是差异不大,其中靶序列长度在18nt,19nt,20nt时,抑制倍数达到最大。
二、sgRNA中重复序列长度变化
为了探究sgRNA表达时所需的最小重复序列长度,对sgRNA中重复序列长度做了不同的截短,作用位点为T1(图4中A),重复序列(自5′端截短)分别为36nt、23nt、21nt、20nt、19nt、18nt、16nt。
具体操作如下:重复序列为36nt的作用于T1位点的sgRNA(FnsgRNA_T1_36nt)的构建见实施例1(图1中D),含有靶序列的引物为F:agatgtggaactggatggtgatgtcaac;R:cttcgttgacatcaccatccagttccac)。
随后以FnsgRNA_T1_36nt质粒为模板,
以正向引物F:ttctactgttgtagatgtggaactggatggtgatgtcaacGAAG,反向引物分别为:
16_R:acatctacaacagtagaaaCTAGTATTATACCTAGGACTGAGCTAG;
18_R:acatctacaacagtagaaataCTAGTATTATACCTAGGACTGAGCTAGC;
19_R:acatctacaacagtagaaattaCTAGTATTATACCTAGGACTGAGCTAG;
20_R:cacatctacaacagtagaaattaACTAGTATTATACCTAGGACTGAGCTAGC;
21_R:acatctacaacagtagaaattatACTAGTATTATACCTAGGACTGAGCTAGC;
23_R:cacatctacaacagtagaaattatttACTAGTATTATACCTAGGACTGAGCTAGCT;
(反向PCR,引物内含有互补序列)分别进行PCR,得到的产物,经DpnI消化,及产物传化后,直接转入DH5α化转感受态,得到重复序列分别为16nt、18nt、19nt、20nt、21nt、23nt的质粒。
分别将FndCpf1的突变体的表达质粒与各sgRNA相关质粒及报告质粒(即实施例1中的报告质粒)共转大肠杆菌DH5α,诱导剂IPTG浓度设置为:100μM,经过流式测试各组中报告蛋白的荧光强度(具体方法参见实施例2)。
结果显示重复序列长度为16nt及18nt时,均几乎无抑制作用,只有在大于19nt时才具有明显的抑制作用(图4中B)。
实施例4、FndCpf1同时作用于编码区多个位点的抑制作用
由于Cpf1具有自加工pre-crRNA的活性,因而作用于多个位点时,可以用一个转录本表达多个sgRNA。为了探究FndCpf1同时作用于多个位点时的抑制作用,在本实验中,发明人设计了两种sgRNA,一种T12,包含作用于报告质粒(即实施例1中的报告质粒)中sfgfp基因的编码区模板链T1、T2两个位点的sgRNA序列;另一种T123,包含作用于报告质粒(即实施例1中的报告质粒)中sfgfp基因的编码区模板链T1、T2、T3三个位点的sgRNA序列,每个位点的sgRNA序列均由重复序列间隔开(图5中A)。
具体操作如下:
1、FnsgRNA_T1_36质粒的构建见实施例3,
2、sgRNA_T12的构建:
以FnsgRNA_T1_36质粒为模板,
T12_F:aaattatttaaagttcttagacgttgacatcaccatccagttccacat;
T12_R:agttcatctgtactactggtaaaGAAGCTTGGGCCCGAACAAA;
为引物,PCR得到的片段1;
T12_O1:gtctaagaactttaaataatttctactgttgtagataagttcatctgtactactggtaa;
T12_O2:ttaccagtagtacagatgaacttatctacaacagtagaaattatttaaagttcttagac;
两引物经退火处理(95℃,10min),得到片段2;随后将片段1与片段2经Gibson方法连接,即得到该质粒。
3、sgRNA_T123的构建:
以sgRNA_T12质粒为模板,
T123_F:cttagactttaccagtagtacagatgaacttatctacaaca;
T123_R:gtagatgtaacgacgctgacttatggtgttGAAGCTTGGGCCCGAACAAA;
为引物,PCR得到的片段1;
T123_O1:ctactggtaaagtctaagaactttaaataatttctactgttgtagatgtaacgacgctg;
T123_O2:cagcgtcgttacatctacaacagtagaaattatttaaagttcttagactttaccagtag;
两引物经退火处理(95℃,10min),得到片段2;随后将片段1与片段2经Gibson方法连接,即得到该质粒。
分别将FndCpf1的突变体的表达质粒与各sgRNA相关质粒及报告质粒(即实施例1中的报告质粒)共转大肠杆菌DH5α,诱导剂IPTG浓度设置为:0,7.8125,31.25,62.5,125,250,500,2000μM,经过流式测试各组中报告蛋白的荧光强度(具体方法参见实施例2)。
实验同时设置阳性对照(P),即不含有sgRNA,但含有FndCpf1及报告质粒的菌株;阴性对照(N),即不含有报告质粒,但含有FndCpf1及sgRNA质粒的菌。
每组设置至少3个重复,结果以均值±标准差的形式表示。
实验结果显示,sgRNA为T1、T12、T123时,其抑制倍数分别约为67倍、119倍、283倍,可以看出随着sgRNA数量的增多,FndCpf1的抑制倍数逐渐增大(图5中B和C)。
实施例5、PAM序列对FndCpf1转录抑制作用的影响
为了验证PAM序列的不同是否会导致FndCpf1抑制作用的不同,发明人将靶序列(T6)5′端上游六个碱基的PAM序列作为研究对象,构建了一个PAM序列库(图6),并验证了该处6个碱基的变化对报告基因(yfg)的表达几乎没有影响,可以确保后续实验中荧光强度的变化是由FndCpf1与不同PAM序列间的作用不同导致的。
其中,PAM序列库构建及富集方法具体如下(图7):
1)PAM克隆库的获取:在构建质粒库之前,首先重新构建了一个报告质粒,该质粒的报告基因选择yfp,并将T6靶点及其附近序列构建在该质粒的启动子下游,该质粒命名为R_PAM(图6,全序列如序列表中序列6所示)。PAM序列测试质粒库是在该质粒的基础上构建的,正向引物含有自由碱基,其序列为Random_F:5′-ATGGTGATGTCAACGGTCATAANNNNNNCGTGCGTGGCGAGGGTGAAG-3′,反向引物Random_R:5′-CCGTTGACATCACCATCCAGTGGTCAGTGCGTCCTGCTGAT-3′,其与正向引物间有16nt的互补序列,用于PCR纯化产物的连接,以R_PAM质粒为模板,进行PCR反应,得到的产物经DpnI酶消化去除模板后,纯化回收,回收产物取300-1000ng直接转入备用的100uL的已含有FndCpf1及sgRNA_T6的DH5α电转感受态,加入37℃预热LB培养基复苏约1h,涂在同时含有氨苄霉素,氯霉素,卡纳霉素的LB平板上,抗生素使用浓度为氨苄霉素100μg/mL,氯霉素20μg/mL,卡纳霉素50μg/mL(之后所使用的培养基均含有三种抗性,不再赘述)。37℃恒温培养箱培养过夜(12-16h)。
2)PAM克隆库的收集:得到单克隆后,用枪头及LB液体培养基将所得的所有单克隆刮除洗下,收集在50mL的无菌离心管中,混合均匀后,稀释约1000倍至新鲜的LB液体培养基,37℃,220rpm,摇床震荡过夜培养12-16h。
3)样品诱导:次日分别取10μL种子液加入3mL含有0,10,20,100μM IPTG的M9培养基,37℃,220rpm,摇床震荡诱导3-4h。
4)流式分选:分别取500μL诱导物加入1mL PBS缓冲液,经流式细胞分选仪分别上样并记录数据后,收集目的菌至含有2mL LB培养基的5mL的离心管中。收集菌的分选范围设置为:10μM IPTG样品中荧光区间前10%,20μM IPTG样品中荧光区间前20%,100μM IPTG样品中荧光区间前50%。每个样品收集细胞约1000000个,随后分别取适当体积的分选液稀释后分别涂板,待用,再将剩余的所有分选菌混合加入含有LB液体培养基的50mL离心管中,37℃,220rpm,摇床震荡过夜培养12-16h,重复步骤3),4),再次分选,一共分选3次。
5)富集后的PAM库中单克隆荧光测试:经3次分选后,分别挑取三次分选后涂在板子上的单克隆,至含有800μL的96孔深孔板中,于96孔板震荡仪中37℃,1000rpm震荡过夜培养12-16h,次日梯度稀释1000倍至含有不同浓度IPTG诱导剂的M9培养基中,于96孔板震荡仪中37℃,1000rpm诱导培养约4.5h后,稀释10倍至含有2mg/mL卡那霉素的PBS缓冲液中,采用BD LSRII流式细胞仪测定各样品荧光值。流式细胞仪参数设置见流式细胞仪荧光定量检测方法。根据测试结果,对不同荧光值对应的单克隆进行菌落PCR鉴定,上游引物设计在启动子上游,下游引物在yfp基因末端下游,保证测序部分中包含PAM序列及yfg基因,根据测序结果分析PAM序列与荧光抑制之间的关系。
利用该PAM序列库,在经过三轮富集筛选后,从每次分选的菌中分别挑取单克隆进行荧光定量测试,选取不同荧光区间的克隆分别进行测序,删除测序结果中的重复序列后最终得到约200种不同PAM序列(表5)的单克隆,同时测试了这200种克隆在不同IPTG浓度下(20μM、100μM)的荧光强度。实验结果显示,不同PAM序列下,FndCpf1的抑制作用不同,在20μM IPTG诱导下,最高荧光值(约6200a.u.)为最低荧光值(约50a.u.)的124倍,100μM IPTG诱导下,差异更为显著,约300倍(图8,表4)。
表4 约200种不同PAM序列的序列及其对应的荧光强度
注:以上荧光值为至少三次不同天次测试的平均值,均减去本底30。
为了探究PAM序列中-1位碱基是否为V(V表示碱基A或C或G)偏好,本发明将所有数据按照5′-TTTTTN-3′,5′-TTTTN-3′,5′-TTTN-3′,5′-TTN-3′,分别进行荧光强度比较,结果如图9,在3′末端为T时对应的荧光值均高于同等条件下其他PAM序列对应的荧光值。且PAM序列为5′-TTTTTT-3′与5′-TTTTTV-3′对应的荧光比值约7.4(PAM序列为5′-TTTTTT-3′对应的荧光平均值/PAM序列为5′-TTTTTV-3′对应的荧光平均值),5′-TTTTT-3′与5′-TTTTV-3′对应的荧光比值约4.3,PAM序列为5′-TTTT-3′与5′-TTTV-3′对应的荧光比值约9.4,PAM序列为5′-TTT-3′与5′-TTV-3′对应的荧光比值约8.4。可见,PAM序列的-1位(3′末端碱基)具有V碱基偏好性,且5′-T富集(5′-TTTTTV-3′/5′-TTTTV-3′/5′-TTTV-3′)具有明显优势。
<110> 中国科学技术大学;中国科学院微生物研究所
<120> 一种可编程的多位点特异性的转录抑制系统及其应用
<130> GNCLN171035
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223>
<400> 1
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 2
<211> 36
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
gtctaagaac tttaaataat ttctactgtt gtagat 36
<210> 3
<211> 8751
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca gtgaagtgct 60
tcatgtggca ggagaaaaaa ggctgcaccg gtgcgtcagc agaatatgtg atacaggata 120
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa 180
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa 240
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg 300
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt 360
ttccccctgg cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca 420
ttccgctgtt atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca 480
gttcgctcca agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta 540
tccggtaact atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca 600
gccactggta attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac 660
tgaaaggaca agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt 720
ggtagctcag agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca 780
agagattacg cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata 840
tttgctcatg agcccgaagt ggcgagcccg atcttcccca tcggtgatgt cggcgatata 900
ggcgccagca accgcacctg tggcgccggt gatgccggcc acgatgcgtc cggcgtagag 960
gatctgctca tgtttgacag cttatcatcg atgcataatg tgcctgtcaa atggacgaag 1020
cagggattct gcaaacccta tgctactccc tcgagccgtc aattgtctga ttcgttacca 1080
attagaattc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 1140
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgccagggtg gtttttcttt 1200
tcaccagtga gactggcaac agctgattgc ccttcaccgc ctggccctga gagagttgca 1260
gcaagcggtc cacgctggtt tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg 1320
gcgggatata acatgagcta tcttcggtat cgtcgtatcc cactaccgag atatccgcac 1380
caacgcgcag cccggactcg gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg 1440
caaccagcat cgcagtggga acgatgccct cattcagcat ttgcatggtt tgttgaaaac 1500
cggacatggc actccagtcg ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga 1560
gatatttatg ccagccagcc agacgcagac gcgccgagac agaacttaat gggcccgcta 1620
acagcgcgat ttgctggtga cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt 1680
cctcatggga gaaaataata ctgttgatgg gtgtctggtc agagacatca agaaataacg 1740
ccggaacatt agtgcaggca gcttccacag caatggcatc ctggtcatcc agcggatagt 1800
taatgatcag cccactgacg cgttgcgcga gaagattgtg caccgccgct ttacaggctt 1860
cgacgccgct tcgttctacc atcgacacca ccacgctggc acccagttga tcggcgcgag 1920
atttaatcgc cgcgacaatt tgcgacggcg cgtgcagggc cagactggag gtggcaacgc 1980
caatcagcaa cgactgtttg cccgccagtt gttgtgccac gcggttggga atgtaattca 2040
gctccgccat cgccgcttcc actttttccc gcgttttcgc agaaacgtgg ctggcctggt 2100
tcaccacgcg ggaaacggtc tgataagaga caccggcata ctctgcgaca tcgtataacg 2160
ttactggttt catattcacc accctgaatt gactctcttc cgggcgctat catgccatac 2220
cgcgaaaggt tttgcgccat tcgatggcgc gccgcttcgt caggccacat agctttcttg 2280
ttctgatcgg aacgatcgtt ggctgtgttg acaattaatc atcggctcgt ataatgtgtg 2340
gaattgtgag cgctcacaat tagctgtcac cggatgtgct ttccggtctg atgagtccgt 2400
gaggacgaaa cagcctctac aaataatttt gtttaaagat ctaaagagga gaaaggatct 2460
atgtcaattt atcaagaatt tgttaataaa tatagtttaa gtaaaactct aagatttgag 2520
ttaatcccac agggtaaaac acttgaaaac ataaaagcaa gaggtttgat tttagatgat 2580
gagaaaagag ctaaagacta caaaaaggct aaacaaataa ttgataaata tcatcagttt 2640
tttatagagg agatattaag ttcggtttgt attagcgaag atttattaca aaactattct 2700
gatgtttatt ttaaacttaa aaagagtgat gatgataatc tacaaaaaga ttttaaaagt 2760
gcaaaagata cgataaagaa acaaatatct gaatatataa aggactcaga gaaatttaag 2820
aatttgttta atcaaaacct tatcgatgct aaaaaagggc aagagtcaga tttaattcta 2880
tggctaaagc aatctaagga taatggtata gaactattta aagccaatag tgatatcaca 2940
gatatagatg aggcgttaga aataatcaaa tcttttaaag gttggacaac ttattttaag 3000
ggttttcatg aaaatagaaa aaatgtttat agtagcaatg atattcctac atctattatt 3060
tataggatag tagatgataa tttgcctaaa tttctagaaa ataaagctaa gtatgagagt 3120
ttaaaagaca aagctccaga agctataaac tatgaacaaa ttaaaaaaga tttggcagaa 3180
gagctaacct ttgatattga ctacaaaaca tctgaagtta atcaaagagt tttttcactt 3240
gatgaagttt ttgagatagc aaactttaat aattatctaa atcaaagtgg tattactaaa 3300
tttaatacta ttattggtgg taaatttgta aatggtgaaa atacaaagag aaaaggtata 3360
aatgaatata taaatctata ctcacagcaa ataaatgata aaacactcaa aaaatataaa 3420
atgagtgttt tatttaagca aattttaagt gatacagaat ctaaatcttt tgtaattgat 3480
aagttagaag atgatagtga tgtagttaca acgatgcaaa gtttttatga gcaaatagca 3540
gcttttaaaa cagtagaaga aaaatctatt aaagaaacac tatctttatt atttgatgat 3600
ttaaaagctc aaaaacttga tttgagtaaa atttatttta aaaatgataa atctcttact 3660
gatctatcac aacaagtttt tgatgattat agtgttattg gtacagcggt actagaatat 3720
ataactcaac aaatagcacc taaaaatctt gataacccta gtaagaaaga gcaagaatta 3780
atagccaaaa aaactgaaaa agcaaaatac ttatctctag aaactataaa gcttgcctta 3840
gaagaattta ataagcatag agatatagat aaacagtgta ggtttgaaga aatacttgca 3900
aactttgcgg ctattccgat gatatttgat gaaatagctc aaaacaaaga caatttggca 3960
cagatatcta tcaaatatca aaatcaaggt aaaaaagacc tacttcaagc tagtgcggaa 4020
gatgatgtta aagctatcaa ggatctttta gatcaaacta ataatctctt acataaacta 4080
aaaatatttc atattagtca gtcagaagat aaggcaaata ttttagacaa ggatgagcat 4140
ttttatctag tatttgagga gtgctacttt gagctagcga atatagtgcc tctttataac 4200
aaaattagaa actatataac tcaaaagcca tatagtgatg agaaatttaa gctcaatttt 4260
gagaactcga ctttggctaa tggttgggat aaaaataaag agcctgacaa tacggcaatt 4320
ttatttatca aagatgataa atattatctg ggtgtgatga ataagaaaaa taacaaaata 4380
tttgatgata aagctatcaa agaaaataaa ggcgagggtt ataaaaaaat tgtttataaa 4440
cttttacctg gcgcaaataa aatgttacct aaggttttct tttctgctaa atctataaaa 4500
ttttataatc ctagtgaaga tatacttaga ataagaaatc attccacaca tacaaaaaat 4560
ggtagtcctc aaaaaggata tgaaaaattt gagtttaata ttgaagattg ccgaaaattt 4620
atagattttt ataaacagtc tataagtaag catccggagt ggaaagattt tggatttaga 4680
ttttctgata ctcaaagata taattctata gatgaatttt atagagaagt tgaaaatcaa 4740
ggctacaaac taacttttga aaatatatca gagagctata ttgatagcgt agttaatcag 4800
ggtaaattgt acctattcca aatctataat aaagattttt cagcttatag caaagggcga 4860
ccaaatctac atactttata ttggaaagcg ctgtttgatg agagaaatct tcaagatgtg 4920
gtttataagc taaatggtga ggcagagctt ttttatcgta aacaatcaat acctaaaaaa 4980
atcactcacc cagctaaaga ggcaatagct aataaaaaca aagataatcc taaaaaagag 5040
agtgtttttg aatatgattt aatcaaagat aaacgcttta ctgaagataa gtttttcttt 5100
cactgtccta ttacaatcaa ttttaaatct agtggagcta ataagtttaa tgatgaaatc 5160
aatttattgc taaaagaaaa agcaaatgat gttcatatat taagtatagc aagaggtgaa 5220
agacatttag cttactatac tttggtagat ggtaaaggca atatcatcaa acaagatact 5280
ttcaacatca ttggtaatga tagaatgaaa acaaactacc atgataagct tgctgcaata 5340
gagaaagata gggattcagc taggaaagac tggaaaaaga taaataacat caaagagatg 5400
aaagagggct atctatctca ggtagttcat gaaatagcta agctagttat agagtataat 5460
gctattgtgg tttttgagga tttaaatttt ggatttaaaa gagggcgttt caaggtagag 5520
aagcaggtct atcaaaagtt agaaaaaatg ctaattgaga aactaaacta tctagttttc 5580
aaagataatg agtttgataa aactggggga gtgcttagag cttatcagct aacagcacct 5640
tttgagactt ttaaaaagat gggtaaacaa acaggtatta tctactatgt accagctggt 5700
tttacttcaa aaatttgtcc tgtaactggt tttgtaaatc agttatatcc taagtatgaa 5760
agtgtcagca aatctcaaga gttctttagt aagtttgaca agatttgtta taaccttgat 5820
aagggctatt ttgagtttag ttttgattat aaaaactttg gtgacaaggc tgccaaaggc 5880
aagtggacta tagctagctt tgggagtaga ttgattaact ttagaaattc agataaaaat 5940
cataattggg atactcgaga agtttatcca actaaagagt tggagaaatt gctaaaagat 6000
tattctatcg aatatgggca tggcgaatgt atcaaagcag ctatttgcgg tgagagcgac 6060
aaaaagtttt ttgctaagct aactagtgtc ctaaatacta tcttacaaat gcgtaactca 6120
aaaacaggta ctgagttaga ttatctaatt tcaccagtag cagatgtaaa tggcaatttc 6180
tttgattcgc gacaggcgcc aaaaaatatg cctcaagatg ctgatgccaa tggtgcttat 6240
catattgggc taaaaggtct gatgctacta ggtaggatca aaaataatca agagggcaaa 6300
aaactcaatt tggttatcaa aaatgaagag tattttgagt tcgtgcagaa taggaataac 6360
tagtactagt ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt 6420
tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat 6480
ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc 6540
aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact 6600
cttttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 6660
ataaatgctt caataatatt gaaaaaggaa gactatgagt attcaacatt tccgtgtcgc 6720
ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 6780
gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 6840
caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 6900
ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact 6960
cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 7020
gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 7080
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 7140
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 7200
agccatacca aacgacgagc gtgacaccac gatgcctgca gcaatggcaa caacgttgcg 7260
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 7320
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 7380
tgctgataaa tctggagccg gtgagcgtgg atctcgcggt atcattgcag cactggggcc 7440
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 7500
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 7560
agaccaagtt tactcatata tactttagat tgatttacgc gccctgtagc ggcgcattaa 7620
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 7680
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 7740
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 7800
aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 7860
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa acttgaacaa 7920
cactcaaccc tatctcgggc tattcttttg atttataagg gattttgccg atttcggcct 7980
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 8040
cgtttacaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 8100
ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 8160
tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 8220
ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 8280
ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 8340
ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtcagg 8400
catttgagaa gcacacggtc acactgcttc cggtagtcaa taaaccggta aaccagcaat 8460
agacataagc ggctatttaa cgaccctgcc ctgaaccgac gaccgggtcg aatttgcttt 8520
cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcacc aggcgtttaa 8580
gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt 8640
tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga 8700
atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat g 8751
<210> 4
<211> 2815
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 60
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 120
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 180
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 240
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 300
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 360
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 420
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 480
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 540
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 600
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 660
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 720
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacaggtt 780
gatcgggcac gtaagaggtt ccaactttca ccataatgaa ataagatcac taccgggcgt 840
attttttgag ttatcgagat tttcaggagc taaggaagct aaaatggaga aaaaaatcac 900
gggatatacc accgttgata tatcccaatg gcatcgtaaa gaacattttg aggcatttca 960
gtcagttgct caatgtacct ataaccagac cgttcagctg gatattacgg cctttttaaa 1020
gaccgtaaag aaaaataagc acaagtttta tccggccttt attcacattc ttgcccgcct 1080
gatgaacgct cacccggagt ttcgtatggc catgaaagac ggtgagctgg tgatctggga 1140
tagtgttcac ccttgttaca ccgttttcca tgagcaaact gaaacgtttt cgtccctctg 1200
gagtgaatac cacgacgatt tccggcagtt tctccacata tattcgcaag atgtggcgtg 1260
ttacggtgaa aacctggcct atttccctaa agggtttatt gagaatatgt tttttgtctc 1320
agccaatccc tgggtgagtt tcaccagttt tgatttaaac gtggccaata tggacaactt 1380
cttcgccccc gttttcacga tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc 1440
gctggcgatc caggttcatc atgccgtttg tgatggcttc catgtcggcc gcatgcttaa 1500
tgaattacaa cagtactgtg atgagtggca gggcggggcg taataatact agctccggca 1560
aaaaaacggg caaggtgtca ccaccctgcc ctttttcttt aaaaccgaaa agattacttc 1620
gcgtttgcca cctgacgtct aagaaaagga atattcagca atttgcccgt gccgaagaaa 1680
ggcccacccg tgaaggtgag ccagtgagtt gattgctacg taattagtta gttagccctt 1740
agtgactcga attcgcggcc gcttctagag ctcggtacca aattccagaa aagaggccgc 1800
gaaagcggcc ttttttcgtt ttggtcctac tagatgcctc cacaccgctc gtcacatcct 1860
gaattctaaa gatctttgac agctagctca gtcctaggta taatactagt gtctaagaac 1920
tttaaataat ttctactgtt gtagatagag acggcgcaac gcaattaatg tgagttagct 1980
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 2040
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg gattcactgg 2100
ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 2160
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 2220
cccaacagtt gcgcagcctg aatggcgaat ggtaacgtct ccgaagcttg ggcccgaaca 2280
aaaactcatc tcagaagagg atctgaatag cgccgtcgac catcatcatc atcatcattg 2340
agtttaaacg gtctccagct tggctgtttt ggcggatgag agaagatttt cagcctgata 2400
cagattaaat cagaacgcag aagcggtctg ataaaacaga atttgcctgg cggcagtagc 2460
gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt 2520
agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc 2580
tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaact ggatccttac 2640
tcgagtctag actgcaggct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 2700
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 2760
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaa 2815
<210> 5
<211> 4590
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
cttcgcgttt gccacctgac gtctaagaaa aggaatattc agcaatttgc ccgtgccgaa 60
gaaaggccca cccgtgaagg tgagccagtg agttgattgc tacgtaatta gttagttagc 120
ccttagtgac tcgaattcga attcctcgtc agttccgctt cgctacagga tccctatctg 180
gagagtgccc gattgggacc cgactttcgc aggagcctat tacggagcca ccaacgacga 240
gacagcagac tgggtccttt cctcacgata gaagtttcag gttgacggct agctcagtcc 300
taggtacagt gctagcatca gcaggacgca ctgacctttg ctgtcaccgg atgtgctttc 360
cggtctgatg agtccgtgag gacgaaacag cctctacaaa taattttgtt taagaattca 420
aaagatcttt taagaaggag atatacatat gcgtaaaggc gaagagctgt tcactggtgt 480
cgtccctatt ctggtggaac tggatggtga tgtcaacggt cataagtttt ccgtgcgtgg 540
cgagggtgaa ggtgacgcaa ctaatggtaa actgacgctg aagttcatct gtactactgg 600
taaactgccg gtaccttggc cgactctggt aacgacgctg acttatggtg ttcagtgctt 660
tgctcgttat ccggaccata tgaagcagca tgacttcttc aagtccgcca tgccggaagg 720
ctatgtgcag gaacgcacga tttcctttaa ggatgacggc acgtacaaaa cgcgtgcgga 780
agtgaaattt gaaggcgata ccctggtaaa ccgcattgag ctgaaaggca ttgactttaa 840
agaagacggc aatatcctgg gccataagct ggaatacaat tttaacagcc acaatgttta 900
catcaccgcc gataaacaaa aaaatggcat taaagcgaat tttaaaattc gccacaacgt 960
ggaggatggc agcgtgcagc tggctgatca ctaccagcaa aacactccaa tcggtgatgg 1020
tcctgttctg ctgccagaca atcactatct gagcacgcaa agcgttctgt ctaaagatcc 1080
gaacgagaaa cgcgatcata tggttctgct ggagttcgta accgcagcgg gcatcacgca 1140
tggtatggat gaactgtaca aatgatgagc caggcatcaa ataaaacgaa aggctcagtc 1200
gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca 1260
cactggctca ccttcgggtg ggcctttctg cgtttataca attgttgggc ctttctgcgt 1320
ttatatacta gtagcggccg ctgcaggagt cactaagggt tagttagtta gattagcaga 1380
aagtcaaaag cctccgaccg gaggcttttg actaaaactt cccttggggt tatcattggg 1440
gctcactcaa aggcggtaat cagataaaaa aaatccttag ctttcgctaa ggatgatttc 1500
tgctagtatt attagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca 1560
ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg 1620
aggcagttcc aaagaatggc aaggtcctgg taacggtctg cgattccgac ccgtccaaca 1680
tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca 1740
tgagtgacga ctgaatccgg tgagaatggc aagagcttgt gcatttcttt ccagacttgt 1800
tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc 1860
atgcgtgatt gcgcctgagc aagacgaaat acacgatcgc tgttaaaagg acaattacaa 1920
acaggaatcg aatgtaaccg gcgcaggaac acggccagcg catcaacaat attttcacct 1980
gaatcaggat attcttctaa tacctggaag gctgttttcc caggaatcgc ggtggtgagt 2040
aaccacgcat catcaggagt acggataaaa tgcttgatgg tcgggagagg cataaactcc 2100
gtcagccagt tgagacggac catctcatct gtaacatcat tggcaacgct acctttgcca 2160
tgtttcagaa acaactctgg cgcatcgggc ttcccataca agcgatagat tgtcgcacct 2220
gattgcccga cattatcgcg agcccattta tacccatata aatcagcgtc catgttggag 2280
tttaagcgcg gacgggagca agacgtttcc cgttgaatat ggctcataac accccttgta 2340
ttactgttta tgtaagcaga cagttttatt gttcatgatg atatattttt atcttgtgca 2400
atgtaacatc agagattttg agacacaacg tggctttgtt gaataaatcg aacttttgct 2460
gagttgaagg atcagctcta gtagttacat tgtcgatctg ttcatggtga acagctttga 2520
atgcaccaaa aactcgtaaa agctctgatg tatctatctt ttttacaccg ttttcatctg 2580
tgcatatgga cagttttccc tttgatatgt aacggtgaac agttgttcta cttttgtttg 2640
ttagtcttga tgcttcactg atagatacaa gagccataag aacctcagat ccttccgtat 2700
ttagccagta tgttctctag tgtggttcgt tgtttttgcg tgagccatga gaacgaacca 2760
ttgagatcat acttactttg catgtcactc aaaaattttg cctcaaaact ggtgagctga 2820
atttttgcag ttaaagcatc gtgtagtgtt tttcttagtc cgttatgtag gtaggaatct 2880
gatgtaatgg ttgttggtat tttgtcacca ttcattttta tctggttgtt ctcaagttcg 2940
gttacgagat ccatttgtct atctagttca acttggaaaa tcaacgtatc agtcgggcgg 3000
cctcgcttat caaccaccaa tttcatattg ctgtaagtgt ttaaatcttt acttattggt 3060
ttcaaaaccc attggttaag ccttttaaac tcatggtagt tattttcaag cattaacatg 3120
aacttaaatt catcaaggct aatctctata tttgccttgt gagttttctt ttgtgttagt 3180
tcttttaata accactcata aatcctcata gagtatttgt tttcaaaaga cttaacatgt 3240
tccagattat attttatgaa tttttttaac tggaaaagat aaggcaatat ctcttcacta 3300
aaaactaatt ctaatttttc gcttgagaac ttggcatagt ttgtccactg gaaaatctca 3360
aagcctttaa ccaaaggatt cctgatttcc acagttctcg tcatcagctc tctggttgct 3420
ttagctaata caccataagc attttcccta ctgatgttca tcatctgagc gtattggtta 3480
taagtgaacg ataccgtccg ttctttcctt gtagggtttt caatcgtggg gttgagtagt 3540
gccacacagc ataaaattag cttggtttca tgctccgtta agtcatagcg actaatcgct 3600
agttcatttg ctttgaaaac aactaattca gacatacatc tcaattggtc taggtgattt 3660
taatcactat accaattgag atgggctagt caatgataat tacatgtcct tttcctttga 3720
gttgtgggta tctgtaaatt ctgctagacc tttgctggaa aacttgtaaa ttctgctaga 3780
ccctctgtaa attccgctag acctttgtgt gttttttttg tttatattca agtggttata 3840
atttatagaa taaagaaaga ataaaaaaag ataaaaagaa tagatcccag ccctgtgtat 3900
aactcactac tttagtcagt tccgcagtat tacaaaagga tgtcgcaaac gctgtttgct 3960
cctctacaaa acagacctta aaaccctaaa ggcttaagta gcaccctcgc aagctcgggc 4020
aaatcgctga atattccttt tgtctccgac catcaggcac ctgagtcgct gtctttttcg 4080
tgacattcag ttcgctgcgc tcacggctct ggcagtgaat gggggtaaat ggcactacag 4140
gcgcctttta tggattcatg caaggaaact acccataata caagaaaagc ccgtcacggg 4200
cttctcaggg cgttttatgg cgggtctgct atgtggtgct atctgacttt ttgctgttca 4260
gcagttcctg ccctctgatt ttccagtctg accacttcgg attatcccgt gacaggtcat 4320
tcagactggc taatgcaccc agtaaggcag cggtatcatc aacaggctta cccgtcttac 4380
tgtccctagt gcttggattc tcaccaataa aaaacgcccg gcggcaaccg agcgttctga 4440
acaaatccag atggagttct gaggtcatta ctggatctat caacaggagt ccaagcgagc 4500
tcgtaaactt ggtctgacag ctctagctcc ggcaaaaaaa cgggcaaggt gtcaccaccc 4560
tgcccttttt ctttaaaacc gaaaagatta 4590
<210> 6
<211> 4652
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
ttgccacctg acgtctaaga aaaggaatat tcagcaattt gcccgtgccg aagaaaggcc 60
cacccgtgaa ggtgagccag tgagttgatt gctacgtaat tagttagtta gcccttagtg 120
actcgaattc gaattcctcg tcagttccgc ttcgctacag gatccctatc tggagagtgc 180
ccgattggga cccgactttc gcaggagcct attacggagc cactgatgct agcactgtac 240
cttgggtcct ttcctcacga tagaagtttc aggttgacgg ctagctcagt cctaggtaca 300
gtgctagcat cagcaggacg cactgaccac tggatggtga tgtcaacggt cataagtttt 360
ccgtgcgtgg cgagggtgaa ggtgacgcaa ctaatggtag ctgtcaccgg atgtgctttc 420
cggtctgatg agtccgtgag gacgaaacag cctctacaaa taattttgtt taatactaga 480
gaaagaggag aaatactaga tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc 540
catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg 600
cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct 660
gcccgtgccc tggcccaccc tcgtgaccac cttcggctac ggcctgcaat gcttcgcccg 720
ctaccccgac cacatgaagc tgcacgactt cttcaagtcc gccatgcccg aaggctacgt 780
ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa 840
gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga 900
cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat 960
ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga 1020
cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt 1080
gctgctgccc gacaaccact acctgagcta ccagtccgcc ctgagcaaag accccaacga 1140
gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat 1200
ggacgagctg tacaagtaat aggccaggca tcaaataaaa cgaaaggctc agtcgaaaga 1260
ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga gtcacactgg 1320
ctcaccttcg ggtgggcctt tctgcgttta tacaattgtt gggcctttct gcgtttatat 1380
actagtagcg gccgctgcag gagtcactaa gggttagtta gttagattag cagaaagtca 1440
aaagcctccg accggaggct tttgactaaa acttcccttg gggttatcat tggggctcac 1500
tcaaaggcgg taatcagata aaaaaaatcc ttagctttcg ctaaggatga tttctgctag 1560
tattattaga aaaactcatc gagcatcaaa tgaaactgca atttattcat atcaggatta 1620
tcaataccat atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag 1680
ttccaaagaa tggcaaggtc ctggtaacgg tctgcgattc cgacccgtcc aacatcaata 1740
caacctatta atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg 1800
acgactgaat ccggtgagaa tggcaagagc ttgtgcattt ctttccagac ttgttcaaca 1860
ggccagccat tacgctcgtc atcaaaatca ctcgcatcaa ccaaaccgtt attcatgcgt 1920
gattgcgcct gagcaagacg aaatacacga tcgctgttaa aaggacaatt acaaacagga 1980
atcgaatgta accggcgcag gaacacggcc agcgcatcaa caatattttc acctgaatca 2040
ggatattctt ctaatacctg gaaggctgtt ttcccaggaa tcgcggtggt gagtaaccac 2100
gcatcatcag gagtacggat aaaatgcttg atggtcggga gaggcataaa ctccgtcagc 2160
cagttgagac ggaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc 2220
agaaacaact ctggcgcatc gggcttccca tacaagcgat agattgtcgc acctgattgc 2280
ccgacattat cgcgagccca tttataccca tataaatcag cgtccatgtt ggagtttaag 2340
cgcggacggg agcaagacgt ttcccgttga atatggctca taacacccct tgtattactg 2400
tttatgtaag cagacagttt tattgttcat gatgatatat ttttatcttg tgcaatgtaa 2460
catcagagat tttgagacac aacgtggctt tgttgaataa atcgaacttt tgctgagttg 2520
aaggatcagc tctagtagtt acattgtcga tctgttcatg gtgaacagct ttgaatgcac 2580
caaaaactcg taaaagctct gatgtatcta tcttttttac accgttttca tctgtgcata 2640
tggacagttt tccctttgat atgtaacggt gaacagttgt tctacttttg tttgttagtc 2700
ttgatgcttc actgatagat acaagagcca taagaacctc agatccttcc gtatttagcc 2760
agtatgttct ctagtgtggt tcgttgtttt tgcgtgagcc atgagaacga accattgaga 2820
tcatacttac tttgcatgtc actcaaaaat tttgcctcaa aactggtgag ctgaattttt 2880
gcagttaaag catcgtgtag tgtttttctt agtccgttat gtaggtagga atctgatgta 2940
atggttgttg gtattttgtc accattcatt tttatctggt tgttctcaag ttcggttacg 3000
agatccattt gtctatctag ttcaacttgg aaaatcaacg tatcagtcgg gcggcctcgc 3060
ttatcaacca ccaatttcat attgctgtaa gtgtttaaat ctttacttat tggtttcaaa 3120
acccattggt taagcctttt aaactcatgg tagttatttt caagcattaa catgaactta 3180
aattcatcaa ggctaatctc tatatttgcc ttgtgagttt tcttttgtgt tagttctttt 3240
aataaccact cataaatcct catagagtat ttgttttcaa aagacttaac atgttccaga 3300
ttatatttta tgaatttttt taactggaaa agataaggca atatctcttc actaaaaact 3360
aattctaatt tttcgcttga gaacttggca tagtttgtcc actggaaaat ctcaaagcct 3420
ttaaccaaag gattcctgat ttccacagtt ctcgtcatca gctctctggt tgctttagct 3480
aatacaccat aagcattttc cctactgatg ttcatcatct gagcgtattg gttataagtg 3540
aacgataccg tccgttcttt ccttgtaggg ttttcaatcg tggggttgag tagtgccaca 3600
cagcataaaa ttagcttggt ttcatgctcc gttaagtcat agcgactaat cgctagttca 3660
tttgctttga aaacaactaa ttcagacata catctcaatt ggtctaggtg attttaatca 3720
ctataccaat tgagatgggc tagtcaatga taattacatg tccttttcct ttgagttgtg 3780
ggtatctgta aattctgcta gacctttgct ggaaaacttg taaattctgc tagaccctct 3840
gtaaattccg ctagaccttt gtgtgttttt tttgtttata ttcaagtggt tataatttat 3900
agaataaaga aagaataaaa aaagataaaa agaatagatc ccagccctgt gtataactca 3960
ctactttagt cagttccgca gtattacaaa aggatgtcgc aaacgctgtt tgctcctcta 4020
caaaacagac cttaaaaccc taaaggctta agtagcaccc tcgcaagctc gggcaaatcg 4080
ctgaatattc cttttgtctc cgaccatcag gcacctgagt cgctgtcttt ttcgtgacat 4140
tcagttcgct gcgctcacgg ctctggcagt gaatgggggt aaatggcact acaggcgcct 4200
tttatggatt catgcaagga aactacccat aatacaagaa aagcccgtca cgggcttctc 4260
agggcgtttt atggcgggtc tgctatgtgg tgctatctga ctttttgctg ttcagcagtt 4320
cctgccctct gattttccag tctgaccact tcggattatc ccgtgacagg tcattcagac 4380
tggctaatgc acccagtaag gcagcggtat catcaacagg cttacccgtc ttactgtccc 4440
tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagcgtt ctgaacaaat 4500
ccagatggag ttctgaggtc attactggat ctatcaacag gagtccaagc gagctcgtaa 4560
acttggtctg acagctctag ctccggcaaa aaaacgggca aggtgtcacc accctgccct 4620
ttttctttaa aaccgaaaag attacttcgc gt 4652

Claims (10)

1.一种可编程的多位点特异性的转录抑制系统,包括如下(A)和(B):
(A)位点特异性转录抑制蛋白,或者能够表达所述位点特异性转录抑制蛋白的DNA环状质粒或DNA线性片段或体外转录的RNA或mRNA;
所述位点特异性转录抑制蛋白为将来自于弗朗西斯菌(Francisella novicida)U112的Cpf1蛋白的第917位氨基酸由天冬氨酸突变为丙氨酸后得到的蛋白;
(B)靶向多个位点的可编程sgRNA,或者能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段;
所述靶向多个位点的可编程sgRNA,由19-36nt的重复序列以及可变的16-31nt的间隔序列自5’端到3’端依次交替排列构成。
2.根据权利要求1所述的转录抑制系统,其特征在于:所述转录抑制系统为如下(a)或(b)或(c):
(a)由所述位点特异性转录抑制蛋白和所述靶向多个位点的可编程sgRNA组成;
(b)由既能够表达所述位点特异性转录抑制蛋白也能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段组成;
(c)由能够表达所述位点特异性转录抑制蛋白的DNA环状质粒或DNA线性片段或体外转录的RNA或mRNA,以及能够转录所述靶向多个位点的可编程sgRNA的DNA环状质粒或DNA线性片段组成。
3.根据权利要求1或2所述的转录抑制系统,其特征在于:所述靶向多个位点的可编程sgRNA中,所述重复序列的长度为19nt;和/或
所述靶向多个位点的可编程sgRNA中,所述间隔序列的长度为18-20nt。
4.根据权利要求1-3中任一所述的转录抑制系统,其特征在于:所述靶向多个位点的可编程sgRNA中,所述重复序列为来自于弗朗西斯菌(Francisella novicida)U112的sgRNA的重复序列。
5.根据权利要求1-4中任一所述的转录抑制系统,其特征在于:所述位点特异性转录抑制蛋白的氨基酸序列如序列表中序列1所示。
6.根据权利要求1-5中任一所述的转录抑制系统,其特征在于:所述靶向多个位点的可编程sgRNA中,所述重复序列为至少含有序列表中序列2自3’末端起的19个核苷酸,并且从序列2自3’末端起的第20个核苷酸起沿着序列2向5’端延长,得到的长度为19-36nt的单链RNA。
7.权利要求1-6中任一所述的转录抑制系统在抑制目的基因转录中的应用。
8.根据权利要求7所述的应用,其特征在于:利用所述转录抑制系统抑制所述目的基因转录的过程中,以所述目的基因中符合如下条件的序列作为PAM序列:3’末端的碱基为A或C或G,5’端富含碱基T的序列。
9.根据权利要求8所述的应用,其特征在于:所述PAM序列为5′-TTTTTV-3′、5′-TTTTV-3′或5′-TTTV-3′;其中,V为A或C或G。
10.CRISPR-Cpf1系统在制备用于抑制靶标基因转录的系统中的应用;所述CRISPR-Cpf1系统中的Cpf1蛋白为将来自于弗朗西斯菌(Francisella novicida)U112的Cpf1蛋白的第917位氨基酸由天冬氨酸突变为丙氨酸后得到的蛋白。
CN201710497198.2A 2017-06-26 2017-06-26 一种可编程的多位点特异性的转录抑制系统及其应用 Pending CN107312790A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710497198.2A CN107312790A (zh) 2017-06-26 2017-06-26 一种可编程的多位点特异性的转录抑制系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710497198.2A CN107312790A (zh) 2017-06-26 2017-06-26 一种可编程的多位点特异性的转录抑制系统及其应用

Publications (1)

Publication Number Publication Date
CN107312790A true CN107312790A (zh) 2017-11-03

Family

ID=60180716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710497198.2A Pending CN107312790A (zh) 2017-06-26 2017-06-26 一种可编程的多位点特异性的转录抑制系统及其应用

Country Status (1)

Country Link
CN (1) CN107312790A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108486146A (zh) * 2018-03-16 2018-09-04 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN109593763A (zh) * 2018-04-27 2019-04-09 四川大学华西医院 一种FnCpf1介导的体外DNA编辑试剂盒
CN110747187A (zh) * 2019-11-13 2020-02-04 电子科技大学 识别TTTV、TTV双PAM位点的Cas12a蛋白、植物基因组定向编辑载体及方法
CN116254268A (zh) * 2023-05-11 2023-06-13 北京蓝晶微生物科技有限公司 一种启动子库及其在不同细菌中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3009511A2 (en) * 2015-06-18 2016-04-20 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2017106657A1 (en) * 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3009511A2 (en) * 2015-06-18 2016-04-20 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2017106657A1 (en) * 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BERND ZETSCHE ET AL.: ""Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System"", 《CELL》 *
LINYI GAO ET AL.: ""Engineered Cpf1 variants with altered PAM specificities increase genome targeting range"", 《NAT BIOTECHNOL.》 *
XU TANG ET AL.: ""A CRISPR–Cpf1 system for effcient genome editing and transcriptional repression in plants"", 《NATURE PLANTS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108486146A (zh) * 2018-03-16 2018-09-04 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN108486146B (zh) * 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN109593763A (zh) * 2018-04-27 2019-04-09 四川大学华西医院 一种FnCpf1介导的体外DNA编辑试剂盒
CN109593763B (zh) * 2018-04-27 2021-10-29 四川大学华西医院 一种FnCpf1介导的体外DNA编辑试剂盒
CN110747187A (zh) * 2019-11-13 2020-02-04 电子科技大学 识别TTTV、TTV双PAM位点的Cas12a蛋白、植物基因组定向编辑载体及方法
CN110747187B (zh) * 2019-11-13 2022-10-21 电子科技大学 识别TTTV、TTV双PAM位点的Cas12a蛋白、植物基因组定向编辑载体及方法
CN116254268A (zh) * 2023-05-11 2023-06-13 北京蓝晶微生物科技有限公司 一种启动子库及其在不同细菌中的应用
CN116254268B (zh) * 2023-05-11 2023-08-15 北京蓝晶微生物科技有限公司 一种启动子库及其在不同细菌中的应用

Similar Documents

Publication Publication Date Title
US9783801B2 (en) Methods for creating and identifying functional RNA interference elements
CN107312790A (zh) 一种可编程的多位点特异性的转录抑制系统及其应用
CN107208096A (zh) 基于crispr的组合物和使用方法
Gunnery et al. Termination sequence requirements vary among genes transcribed by RNA polymerase III
US11453867B2 (en) CRISPR DNA targeting enzymes and systems
US20040038401A1 (en) Cloning vectors and vector components
DK2828384T3 (en) PROCEDURE FOR SURVIVING SENSITIVITY TO CHEMICAL DNA MODIFICATIONS OF CONSTRUCTED SPEECH DNA BINDING DOMAINS
KR102387830B1 (ko) 안정하고 부작용이 적은 게놈 편집용 복합체 및 이를 코딩하는 핵산
JP2018537130A (ja) バチルス由来の改変双方向性カタラーゼプロモーター
CN117413063A (zh) 冠状病毒治疗性干扰颗粒
CN108085287A (zh) 一种重组谷氨酸棒状杆菌、其制备方法及其应用
SIMPSON et al. Requirements for mini-exon inclusion in potato invertase mRNAs provides evidence for exon-scanning interactions in plants
US20220282283A1 (en) Novel crispr dna targeting enzymes and systems
CN113549650B (zh) 一种CRISPR-SaCas9基因编辑系统及其应用
CN114990112A (zh) 一种皮刺特异启动子
CN110835630A (zh) 一种高效的sgRNA及其在基因编辑中的应用
CN110835631A (zh) 一种改造的sgRNA及其在提高碱基编辑效率中的应用
Wong et al. Promoter analysis of a soybean nuclear gene coding for nodulin‐23, a nodule‐specific polypeptide involved in symbiosis with Rhizobium
US20240082327A1 (en) Retroviral vectors
US20200392482A1 (en) Self-diversifying systems and methods of use thereof
US6057095A (en) Screening procedure for inhibitors of HIV Rev function
RU2730663C2 (ru) Генотерапевтический ДНК-вектор на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген Cas9 для гетерологичной экспрессии этого целевого гена в клетках человека и животных при реализации различных методов геномного редактирования, способ получения и применения генотерапевтического ДНК-вектора, штамм Escherichia coli SCS110-AF/VTvaf17-Cas9, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора
US20220273821A1 (en) Retroviral vectors
AU2021336262A1 (en) Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna
CN111304242A (zh) 一种基于SaKKHn-pBE系统制备单突变体的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103