CN110951741B - 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统 - Google Patents

一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统 Download PDF

Info

Publication number
CN110951741B
CN110951741B CN201911387447.8A CN201911387447A CN110951741B CN 110951741 B CN110951741 B CN 110951741B CN 201911387447 A CN201911387447 A CN 201911387447A CN 110951741 B CN110951741 B CN 110951741B
Authority
CN
China
Prior art keywords
plasmid
bacillus subtilis
expression
dcpf1
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911387447.8A
Other languages
English (en)
Other versions
CN110951741A (zh
Inventor
刘龙
武耀康
堵国成
李江华
陈坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201911387447.8A priority Critical patent/CN110951741B/zh
Publication of CN110951741A publication Critical patent/CN110951741A/zh
Application granted granted Critical
Publication of CN110951741B publication Critical patent/CN110951741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统。本发明通过构建的Cpf1表达载体pHT‑XCR6和crRNA阵列表达载体pcrF11,可以一次性完成2个基因的完全敲除,6个基因的碱基修饰以及1个基因的敲入。载体pHT‑XCR6上包含NgAgo蛋白,用于促进recA介导的同源重组。同时构建了载体pLCg6‑dCpf1‑remA(用于将DNA酶失活的Cpf1突变体dCpf1和转录激活因子remA的融合蛋白在枯草芽孢杆菌基因组上的整合表达)和pcra3(用于crRNA阵列在枯草芽孢杆菌基因组上的整合表达),可以用于同时对不同基因进行转录抑制和激活。本发明还建立一种经济高效的名为SOMACA(Synthetic Oligos Mediated Assembly of crRNA Array)的crRNA阵列组装方法,可通过合成短单链DNA(<60nt)将所需的crRNA阵列插入到载体pcrF11或pcra3上,用于引导Cpf1或dCpf1‑remA进行基因编辑和表达调控。

Description

一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调 控系统
技术领域
本发明涉及一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,属于基因工程技术领域。
背景技术
枯草芽孢杆菌(Bacillus subtilis)是一种被广泛用作食品酶制剂及重要营养化学品的生产宿主,其产品被FDA认证为“generally regarded as safe”(GRAS)安全级别;除此之外,其还是革兰氏阳性模式微生物,也常被用于微生物机理的研究。为了防止噬菌体的入侵,微生物进化出了很多防御系统,而CRISPR-Cas(clustered regularly interspacedshort palindromic repeats and CRISPR-associated proteins)系统则是其中比较常见的一种获得性免疫系统。以目前研究最为广泛的酿脓链球菌(Streptococcus pyogenes)的CRISPR/Cas9系统为例,其作用机制如下:当第一次受到新的噬菌体入侵时,其会将噬菌体基因组上的原间隔序列(postospacer)作为新的间隔序列插入到基因组上CRISPR序列的起始序列之后,作为第一个间隔序列;当再次受到该噬菌体入侵式,该CRISPR序列会转录产生一条长链RNA,即前体crRNA(pre-crRNA),随后在Cas蛋白复合体和tracrRNA(trans-activating crRNA)的共同作用下,pre-crRNA被剪切产生成熟的crRNAs;tracrRNA与crRNA形成的复合体可以结合Cas9蛋白并引导其识别特定的噬菌体DNA并将其切割产生双链断裂(DSB),从而将其破坏。
利用上述的作用机制,经过人为改造,可以使Cas9蛋白识别并切割细菌的基因组产生DSB;然后通过导入同源模板便可以在同源重组修复的过程中将同源模板上特定的修饰引入到细菌的基因组DNA上;因为没有成功修复的DSB是致死的,因此只有成功修复并引入突变使得Cas9不再识别和切割的细胞才能存活下来,这就是利用CRISPR/Cas9进行基因编辑的基本原理。同时为了操作的方便性,常常将crRNA和tracrRNA构建成一个嵌合体即sgRNA(small guide RNA)进行表达,这样只需要表达sgRNA和Cas9蛋白便可进行基因编辑。目前除了CRISPR/Cas9系统以外,CRISPR/Cpf1系统也常被应用于基因编辑,与CRISPR/Cas9系统不同的是,CRISPR/Cpf1只需要crRNA便可发挥作用;而且Cpf1自身就具有RNA酶的活力,可以对pre-crRNA进行加工;因此可以设计一段由多个crRNA组成的crRNA阵列,当其被Cpf1处理成为多个成熟的crRNA之后便可以同时引导Cpf1在基因组多个位置进行切割,实现多个位点的同时编辑。
除了用于基因编辑以外,CRISPR/Cas9和CRISPR/Cpf1系统还被应用于转录调控中。将Cas9或Cpf1的DNA酶进行失活后得到dCas9或dCpf1,其便不再具有DNA的切割能力,但是仍能在sgRNA或者crRNA的引导下结合到基因组上,这样可以利用其在基因组上的空间位阻阻止RNA聚合酶通过,从而弱化转录过程;将具有转录激活作用的转录因子融合到dCas9后,可以在sgRNA的引导下靶向到启动子上,这样便可招募更多的RNA聚合酶,达到增强(激活)转录的作用。而且已有研究证明,将Cpf1的DNA酶进行失活后其仍具有RNA酶活力,因此也可以通过一个crRNA阵列来实现对多个基因的转录激活或抑制。
目前枯草芽孢杆菌中已经有多项基于CRISPR/Cas9的基因编辑和转录调控系统构建和应用的研究,但是还未有利用CRISPR/Cpf1系统对其进行基因编辑和表达调控的报道。基于CRISPR/Cas9的基因编辑系统在进行多个位点的编辑或调控时,需要表达多个sgRNA,增加了操作的复杂程度;而且每个sgRNA又需要各自的启动子,多个sgRNA之间又有很多重复序列,这增加了质粒构建的难度同时也降低了质粒的稳定性。
发明内容
为解决上述技术问题,本发明提供一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统。本发明构建了一种基于CRISPR/Cpf1系统的枯草芽孢杆菌多基因编辑和表达调控系统,得益于Cpf1自身的RNA酶活力,其可以在一个crRNA阵列的方便快捷的实现对多个位点的同时编辑和转录调控(抑制和激活)。
本发明的第一个目的是提供一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,包括质粒pHT-XCR6、质粒pcrF11、质粒pLCg6-dCpf1-remA或质粒pcra3;所述的质粒pHT-XCR6和质粒pcrF11用于基因编辑;所述的质粒pLCg6-dCpf1-remA和质粒pcra3用于表达调控。
进一步地,所述的质粒pHT-XCR6为Cpf1表达载体,包含Cpf1基因和NgAgo蛋白的编码基因,所述的NgAgo蛋白的氨基酸序列如SEQ ID NO.5所示。NgAgo蛋白自于Natronobacterium gregoryi的Argonaute(NgAgo)蛋白截短突变体,用来促进同源重组提高基因编辑效率。
进一步地,所述的NgAgo蛋白的编码基因通过启动子Pgrac100调控表达。
进一步地,质粒pHT-XCR6是在质粒pHT-XC的基础上连接NgAgo后构建而来;而质粒pHT-XC是将IPTG诱导性启动子Pgrac100和FnCpf1连接到大肠杆菌枯草芽孢杆菌穿梭载体pHT01上之后得到。
进一步地,所述的质粒pcrF11为crRNA阵列表达载体,包括crRNA阵列插入区和同源臂插入区;所述的crRNA阵列插入区设置在启动子下游,用于插入要表达的crRNA阵列;所述的同源臂插入区包含EcoRI,SalI,XbaI和PstI四个酶切位点,用于插入基因编辑中所需的同源臂。
进一步地,所述的质粒pcrF11具体是有以下四部分连接得到:第一部分包含枯草芽孢杆菌复制子RepF(其与pHT-XCR6上的RepA复制子是兼容的)和crRNA阵列插入区及同源臂插入区;第二部分为大肠杆菌复制子ColE1;第三部分包含一个枯草芽孢杆菌单链复制载体和一个在大肠杆菌和枯草芽孢杆菌中都能使用的光谱启动子Pbs;第四部分为卡那霉素抗性基因,用于该质粒在大肠杆菌和枯草芽孢杆菌中的筛选。
进一步地,所述的质粒pHT-XCR6的核苷酸序列如SEQ ID NO.1所示,质粒pcrF11的核苷酸序列如SEQ ID NO.2所示。
进一步地,所述的质粒pLCg6-dCpf1-remA为dCpf1整合表达载体,包括枯草芽孢杆菌lacA基因同源臂、DNA酶活失活的Cpf1突变体dCpf1,以及融合在dCpf1的C端的枯草芽孢杆菌的转录激活因子remA。本发明丧失DNA酶活的dCpf1只能特异性识别和结合DNA而不再切割,可在crRNA的引导下结合到基因组的特定位点;同时枯草芽孢杆菌的转录激活因子remA被融合到了dCpf1的C端,用于目标基因的增强表达。质粒pLCg6-dCpf1-remA将dCpf1-remA融合蛋白整合到基因组的lacA位点。
进一步地,所述的DNA酶活失活的Cpf1突变体dCpf1通过启动子Pgrac100调控表达;所述的启动子后还包括阻遏蛋白lacI的结合位点lacO。
进一步地,质粒pLCg6-dCpf1-remA的构建过程如下:首先将申请号为CN201810036701的专利中的质粒pLCx-dCas9上的dCas9蛋白替换为dCpf1蛋白得到质粒pLCx-dCpf1;然后将其木糖启动子替换为IPTG诱导性启动子Pgrac100得到pLCg5-dCpf1;之后为了降低渗漏表达,又额外在启动子后添加了一个阻遏蛋白lacI的结合位点lacO得到pLCg6-dCpf1;最后将转录激活因子remA融合到dCpf1的C端得到pLCg6-dCpf1-remA。
进一步地,所述的质粒pcra3为crRNA阵列表达载体,包括枯草芽孢杆菌amyE基因的同源臂,以及可将crRNA阵列整合到枯草芽孢杆菌基因组的amyE位点。crRNA可以引导dCpf1结合到基因组的特定位置发挥转录调控作用。
进一步地,质粒pcra3的构建过程如下:1.将质粒pcrF11中的crRNA阵列表达框连接到申请号为CN201810036701的专利中的质粒psga上,得到pcra2;为了降低转录调控系统的渗漏表达,将pcra2的启动子Pveg替换为了启动之Pgrac100后得到pcra3。
进一步地,所述的质粒pLCg6-dCpf1-remA的核苷酸序列如SEQ ID NO.3所示,质粒pcra3的核苷酸序列如SEQ ID NO.4所示。
本发明的第二个目的是提供所述的基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统在枯草芽孢杆菌多基因编辑和表达调控中的应用。
进一步地,所述的多基因编辑,包括如下步骤:
(1)将Cpf1表达载体pHT-XCR6转化到枯草芽孢杆中,涂布氯霉素平板得到阳性菌落;
(2)设计靶向特异性的crRNA阵列,连接到载体pcrF11上;
(3)将连接了crRNA阵列的载体pcrF11和用于基因组编辑的同源臂同时转化到(1)中所述的转化了载体pHT-XCR6的枯草芽孢杆菌中;或者首先将同源臂连接到连接了crRNA阵列的载体pcrF11上之后再进行转化,可以提高编辑的效率;
(4)转化第二个载体后,在涂布平板之前将菌体重悬至含有3%木糖、100ng/μL卡那霉素和5ng/μL氯霉素的LB液体培养基中振荡培养8-10h,之后再离心重悬至200μL并涂布到含有3%木糖、100ng/μL卡那霉素和5ng/μL氯霉素的LB平板;
(5)长出单菌落后使用菌落PCR及测序验证基因编辑情况,阳性菌株可以只消除pcrF11的衍生质粒,方便后续基因编辑操作;也可以同时将pcrF11的衍生质粒和pHT-XCR6消除,得到不含质粒的菌株;
(6)质粒消除的方法如下:将验证正确的阳性菌株转接到含有0.005%SDS的液体LB培养基中振荡培养8-12h,之后若只想消除pcrF11的衍生质粒则可以划线到氯霉素抗性平板,若想同时将pcrF11的衍生质粒和pHT-XCR6消除则划线到不含抗生素的平板上,长出单菌落之后通过菌落PCR筛选得到质粒消除菌株。
本发明的第三个目的是提供一种crRNA阵列组装方法,通过合成短单链DNA,将所需的crRNA阵列插入到包含有Cpf1或dCpf1的载体上,用于引导Cpf1或dCpf1用于基因编辑或表达调控。
进一步地,若只需将一个crRNA插入到质粒中,则只需要合成一对长度都为27-nt的单链DNA引物(其中23-nt为互补序列,可形成双链,剩余4-nt则会形成两个5’突出的粘性末端),然后通过退火得到带有粘性末端的双链DNA,便可使用T4 DNA连接酶连接到经Eco31I酶切后的载体上。
进一步地,若需要将由多个crRNA组成的crRNA阵列插入到载体中,则需要设计带有互补序列的成对引物,通过PCR使其形成两端都具有Eco31I酶切位点的双链DNA,然后便可以同构golden gate的方法将其和载体组装到一起。Golden gate的具体操作可参考文献:Engler C,Gruetzner R,Kandzia R,Marillonnet S.2009.Golden Gate Shuffling:AOne-Pot DNA Shuffling Method Based on Type IIs Restriction Enzymes.Ed.JeanPeccoud.PLoS One 4:e5553.。
本发明的有益效果是:
本发明通过构建的Cpf1表达载体pHT-XCR6和crRNA阵列表达载体pcrF11,可以一次性完成2个基因的完全敲除,6个基因的碱基修饰以及1个基因的敲入。载体pHT-XCR6上包含NgAgo蛋白,用于促进recA介导的同源重组。同时构建了载体pLCg6-dCpf1-remA(用于将DNA酶失活的Cpf1突变体dCpf1和转录激活因子remA的融合蛋白在枯草芽孢杆菌基因组上的整合表达)和pcra3(用于crRNA阵列在枯草芽孢杆菌基因组上的整合表达),可以用于同时对不同基因进行转录抑制和激活。本发明还建立一种经济高效的名为SOMACA(SyntheticOligos Mediated Assembly of crRNAArray)的crRNA阵列组装方法,可通过合成短单链DNA(<60nt)将所需的crRNA阵列插入到载体pcrF11或pcra3上,用于引导Cpf1或dCpf1-remA进行基因编辑和表达调控。
附图说明
图1基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统的基本工作原理。
图2本发明构建的名为SOMACA(Synthetic Oligos Mediated Assembly of crRNAArray)的crRNA阵列组装方法。(A)单个crRNA的组装过程;(B)多个crRNA的组装过程。
图3使用本系统在枯草芽孢杆菌中进行基因编辑的基本过程。(A)依此转化Cpf1和crRNA表达载体以完成基因编辑;(B)crRNA阵列经Cpf1处理后,引导Cpf1切割基因组DNA,并通过同源重组将同源臂中的突变引入;(C)使用菌落PCR验证基因编辑结果。
图4使用本系统在枯草芽孢杆菌中进行转录抑制。(A)本系统进行转录抑制的基本原理,dCpf1和crRNA被整合在枯草芽孢杆菌基因组上,dCpf1在crRNA的引导下结合到特定的基因上,阻止RNA聚合酶通过,从而抑制了转录过程;(B)选择不同的crRNA结合位置对抑制强度的影响。
图5转录抑制系统的优化及特性研究。(A)通过增加阻遏蛋白LacI的结合位点lacO降低Cpf1的渗漏表达,将crRNA的启动子替换为IPTG诱导启动子Pgrac100降低crRNA的渗漏表达;(B)抑制强度随IPTG浓度的变化趋势;(C)使用一个sgRNA阵列实现同时对多个基因的转录抑制。
图6使用本系统在枯草芽孢杆菌中进行转录激活。(A)本系统进行转录激活的基本原理,将具有激活作用的转录因子remA融合到dCpf1的C端,使用crRNA将该融合蛋白引导到目标基因的启动子上后,remA会募集更多的RNA,从而增强了转录过程,而将该融合蛋白靶向到基因内部仍可以抑制转录的进行;(B)使用crRNA阵列同时进行多个基因的抑制和激活。
图7使用木糖诱导启动子PxylA表达dCpf1时的抑制效果。(A)转录抑制作用机制示意图;(B)不同crRNA对抑制强度的影响。
图8融合不同转录因子后的抑制与激活效果。(A)融合不同转录因子后的抑制效果;(B)使用不同crRNA验证了融合不同转录因子后的激活效果。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
为了方便构建基因编辑或表达调控过程中所使用的crRNA阵列,设计了一种名为SOMACA(Synthetic Oligos Mediated Assembly of crRNA Array)的方法,可通过合成短单链DNA(<60nt)将所需的crRNA阵列插入到载体上(图2)。(1)当只需将一个crRNA插入到质粒中时,则只需要合成一对长度都为27-nt的单链DNA引物(其中23-nt为互补序列,可形成双链,剩余4-nt则会形成两个5’突出的粘性末端),然后通过退火得到带有粘性末端的双链DNA,便可使用T4 DNA连接酶连接到经Eco31I酶切后的载体上。(2)当需要将由多个crRNA组成的crRNA阵列插入到载体中时,则需要设计带有互补序列的成对引物,通过PCR使其形成两端都具有Eco31I酶切位点的双链DNA,然后便可以通过golden gate的方法将其和载体组装到一起。Golden gate的具体操作可参考文献:Engler C,Gruetzner R,Kandzia R,Marillonnet S.2009.Golden Gate Shuffling:A One-Pot DNA Shuffling Method Basedon Type IIs Restriction Enzymes.Ed.Jean Peccoud.PLoS One 4:e5553.。
实施例1:构建Cpf1表达载体pHT-XCR6
首先使用序列如5’-ctgcagaacgctcggttgccgccgggcgttttttcgtcattcctctagagtcgacgtcc-3’和5’-cgctcccttttccgttag-3’所示的引物通过PCR将质粒pHT01进行线性化并使用内切酶DpnI消化模板DNA;以质粒pLCx-dCas9为模板扩增木糖启动子PxylA;以PY001为模板(来源于文献:Zetsche B,Gootenberg JS,Abudayyeh OO,Slaymaker IM,MakarovaKS,Essletzbichler P,Volz SE,Joung J,Van Der Oost J,Regev A,Koonin E V.,ZhangF.2015.Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2CRISPR-CasSystem.Cell 163:759–771.http://dx.doi.org/10.1016/j.cell.2015.09.038.)扩增FnCpf1基因;最后通过无缝克隆试剂盒便可将PxylA和FnCpf1连接到载体pHT01上得到载体pHT-XC。
接着使用序列如5’-ctaatgtcggattcctctaatcctctagagtcgacgtcc-3’和5’-atgacgaaaaaacgcccg-3’所示的引物通过PCR将载体pHT-XC进行线性化并使用内切酶DpnI消化模板DNA;以质粒pHT00为模板扩增IPTG诱导型启动子Pgrac100;NgAgo使用序列如5’-atgcgatgcctggggacg cagatatgttcattgggattGCGgtctctcggagctacccc-3’和5’-tcttcgttcatgaagccCGCacggtggatgacgatatgg-3’所示的引物,以及以序列如5’-GCGggcttcatgaacgaagacc-3’和5’-ttagaggaatccgacattagactc-3’所示的引物以pBBR1MCS2-Tac-NgAgo为模板分两段扩增,得到参考文献Fu L,Xie C,Jin Z,Tu Z,Han L,Jin M,Xiang Y,Zhang A.2019.The prokaryotic Argonaute proteins enh ancehomology sequence-directed recombination in bacteria.Nucleic Acids Res.47:3568–3579.https://academic.oup.com/nar/article/47/7/3568/5304309.中所述的截断突变体(氨基酸序列如SEQ ID NO:5所示);最后同样通过无缝克隆试剂盒将Pgrac100和NgAgo连接到载体pH T-XC上得到载体pHT-XCR6(序列如SEQ ID NO:1所示)。
实施例2:构建crRNA阵列表达载体pcrF11
首先以合成的DNA为模板,扩增由crRNA插入区和枯草芽孢杆菌复制子repF组成的DNA片段;接着通过以质粒pUC57-Kan为模板,扩增卡那霉素抗性基因;然后以合成的DNA序列为模板,扩增由枯草芽孢杆菌单链复制子ssoU和启动子Pbs组成的片段,最后以质粒pP43-egfp为模板,扩增大肠杆菌复制子ori;最后通过无缝克隆试剂盒将上述四个片段进行拼接,得到载体pcrF11(序列如SEQ ID NO:2所示)。
实施例3:基于CRISPR/Cpf1系统在枯草芽孢杆菌进行多基因编辑
基因编辑时首先将pHT-XCR6转化到枯草芽孢杆菌中,同时将根据基因组编辑需要设计所需crRNA阵列和同源臂将其分别添加到质粒pcrF11上。在此选择了枯草芽孢杆菌中主要的6个胞外蛋白酶基因aprE、epr、nprE、bpr、mpr和nprB作为目标基因进行验证。经验证,若将同源臂整合到pcrF11上,可以一次性实现两个基因的完全删除,六个位点的部分碱基突变或者一个基因的插入;而若是同源臂片段不插入到pcrF11中,而是和插入了crRNA的pcrF11进行共转化时,可能由于转化效率降低,只能一次性完全删除一个基因,或两个位点进行部分碱基的突变,也可以一次实现一个基因的整合。
在一次性进行两个基因的完全删除时,使用SOMACA策略:设计了两对引物(5’-ACTGGTCTCAagattcaccataggccctct-3’和5’-ACTGGTCTCAACCTatgagcgagagggcctatggtgaatct-3’,5’-ACTGGTCTCAAGGTaatttctactgttgtagatggtaagaaattgtctg-3’和5’-ACTGGTCTCAaattacagcaac agacaatttcttaccatctacaacagt-3’),经过PCR后形成两个双链DNA,然后使用golden gate将两个片段组装到pcrF11上,得到了含有分别靶向epr和nprE基因的crRNA阵列表达载体pcr F11-2C;然后设计四对基因,分别用于扩增用于基因epr和nprE删除的上游和下游同源臂,并通过融合PCR得到基因epr和nprE的敲除框,通过使用无缝克隆试剂盒将其连接到Eco RI和PstI酶切后的载体pcrF11-2C上得到载体pcrF11-2C-DEL;最后将pcrF11-2C-DEL转化到含有质粒pHT-XCR6的菌株中便可实现同时对于基因epr和nprE的同时敲除。
在一次性进行六个位点的部分碱基突变时,首先设计6对引物(5’-ACTGGTCTCAagat cgttaacgttaatctttacgatg-3’和5’-ACTGGTCTCAACCTcatcgtaaagattaacgttaacgatctT-3’,5’-ACTG GTCTCAAGGTaatttctactgttgtagattcaccataggccctc-3’和5’-ACTGGTCTCAGTGGatgagcgagagggc ctatggtgaatctaca-3’,5’-ACTGGTCTCACCACaatttctactgttgtagatggtaagaaattgtctg-3’和5’-ACTGG TCTCATACCacagcaacagacaatttcttaccatctacaacagt-3’,5’-ACTGGTCTCAGGTAaatttctactgttgtagat gcaccaaaggacgcggaaggaaa-3’和5’-ACTGGTCTCATCGGtttccttccgcgtcctttg-3’,5’-ACTGGTCTC ACCGAaatttctactgttgtagatgtagcatcagcttctttaccggt-3’和5’-TCTGGTCTCACGTAaccggtaaagaagctg atgc-3’,5’-ACTGGTCTCATACGaatttctactgttgtagattaacacatgcctcagctgaagaa-3’和5’-ACTGGTC TCAaattttcttcagctgaggcatgtgttaatctaca-3’)通过SOMACA策略得到了靶向aprE、epr、nprE、bpr、mpr和nprB的crRNA阵列表达载体pcrF11-6C;然后使用相同的方法将含有部分碱基修饰对的同源臂片段插入到载体pcrF11-6C上得到pcrF11-6C-NM;最后将pcrF11-6C-NM转化到含有质粒pHT-XCR6的菌株中便可实现同时对基因aprE、epr、nprE、bpr、mpr和npr B引入碱基突变;在此选择在基因内部插入了多个终止密码子TAA造成了无义突变从而使这些基因失活。
在进行基因插入时使用SOMACA策略,合成1对引物(5’-agatcgttaacgttaatctttacgatg-3’和5’-aattcatcgtaaagattaacgttaacg-3’)经过退火形成了带有粘性末端的双链DNA,然后连接到EcoR31I酶切后的载体pcrF11上得到靶向aprE基因的crRNA表达载体pcrF11-1C,将用于YFP插入表达的同源臂使用相同方法插入到pcrF11-1C上后得到载体pcrF11-1C-YFP;最后将pcrF11-1C-YFP转化到含有质粒pHT-XCR6的菌株中便可实现将YFP插入到基因组的aprE位点。上述编辑过程完成后,首先使用菌落PCR进行验证,然后将基因组上的序列扩增下来进行测序。经验证,上述过程的编辑效率均为100%。确定完成所需编辑之后可使用如下方法进行质粒消除:将验证正确的阳性菌株转接到含有0.005%SDS的液体LB培养基中振荡培养8-12h,之后若只想消除pcrF11的衍生质粒则可以划线到氯霉素抗性平板,若想同时将pcrF11的衍生质粒和pHT-XCR6消除则划线到不含抗生素的平板上。长出单菌落之后通过菌落PCR筛选得到质粒消除菌株。
实施例4:构建dCpf1-remA融合蛋白整合表达载体pLCg6-dCpf1-remA
首先使用序列如5’-ctgcagcgtcatcacgaa-3’和5’-aattgacatggatcccatttccccc-3’所示的引物将质粒pLCx-dCas9线性化,然后以含有Cpf1的载体PY001为模板使用序列如5’-aaatgggatccatgt caatttatcaagaatttgttaataaatatagtttaagtaaaact-3’和5’-aaatgtctttcacctctAGCtatacttaatatatgaacatcatttgctt tttcttttag-3’以及5’-GCTagaggtgaaagacatttagcttacta-3’和5’-ctttcgtgatgacgctgcagttagttattcctattctgcacgaactc-3’所示的引物分两段扩增Cpf1,然后通过无缝克隆试剂盒将两个DNA片段与线性化后的pLCx-dCas9连接得到载体pLCx-dCpf1,从而将其上的dCas9替换为Cpf1 DNA酶失活的突变体dCpf1(D917A);然后使用序列如5’-tgggatccatgtcaatttatcaagaatttgttaataaatatagtttaag-3’和5’-cccagctcattgagctgggtttaagcttgcttgtaccgttcgtataatgtatgctatacg-3’所示的引物将质粒pLCx-dC pf1线性化,以pHT100为模板扩增IPTG诱导启动子Pgrac100,然后通过无缝克隆试剂盒将该DNA片段与线性化后的pLCx-dCpf1连接得到载体pLCg5-dCpf1;之后使用序列如5’-taacaa ttCATaattgtgagcggataacaattCAACCCCaaaggaggtgggatccatgtc-3’和5’-ctttGGGGTTGaattgttatccgct cacaattATGaattgttatccgctcacaattccgc-3’所示的引物以pLCg5-dCpf1为模板通过反向PCR扩增引入突变,将额外的一个阻遏蛋白LacI的识别序列lacO插入到启动子Pgrac100后得到载体pLCg6-dCpf1,以降低渗漏表达;最后使用序列如5’-ctgcagaacgctcggttgc-3’和5’-GCTTCCAC CGCCACCgttattcctattctgcacgaactcaaaatact-3’所示的引物将质粒pLCg6-dCpf1线性化,然后以枯草基因组为模板扩增转录因子remA,最后通过无缝克隆试剂盒将该DNA片段与线性化后的pLCg6-dCpf1连接得到载体pLCg6-dCpf1-remA(SEQ ID NO.3)。
实施例5:构建crRNA整合表达载体pcra3
首先使用序列如5’-AACAGGCTGTGAGGCCTGTTTTTTTATTAATCCttttcaaacttagttAGCTTGGCgtcgacatggatgagcga-3’和5’-gcctgcaggtcgacgatt-3’所示的引物将质粒psga线性化,之后以pcrF11为模板扩增受启动子Pveg调控表达的crRNA表达框,最后使用无缝克隆试剂盒将该DNA片段与线性化后的psga连接得到载体pcra2;为了降低crRNA阵列的渗漏表达,将启动子Pveg通过以下步骤替换为IPTG诱导启动子Pgrac100:使用序列如5’-tagAGGTaGAGACGcgagg-3’和5’-cccagctcattgagctgggtttaagcttgcttggcctgcaggtcgacgatt-3’所示的引物将质粒pcra2线性化,然后以pHT100为模板扩增启动子Pgrac00并使用无缝克隆试剂盒将其连接到载体pcra2上得到pcra3(SEQ ID NO.4)。
实施例6:基于CRISPR/Cpf1系统在枯草芽孢杆菌进行多基因表达调控
首先验证了dCpf1的抑制作用,使用质粒pLCg5-dCpf1将dCpf1整合到枯草芽孢杆菌的基因组的lacA位点,然后使用SOMACA策略将所需的crRNA阵列插入到pcra2上,再整合到枯草芽孢杆菌基因组的amyE位点。使用绿色荧光蛋白(GFP)作为报告基因,选择了靶向其模板链不同位置的crRNA,均发现了明显的抑制效果;但是添加IPTG是的渗漏表达也比较严重(图4)。因此又在质粒配LCg-dCpf1上dCpf1的启动子Pgrac100上有添加了一个阻遏蛋白LacI的结合序列lacO,而且也将质粒pcra2上的crRNA阵列的启动子由组成型启动子Pveg替换为了IPTG诱导启动子Pgrac100,从而显著降低了诱导之前的渗漏表达;之后也考察了IPTG浓度对抑制强度的影响,发现随着IPTG浓度提高抑制强度逐渐增强,且在0.1mM时达到最大,超过此浓度也不再增强;同时选择了黄色荧光蛋白(YFP)、蓝色荧光蛋白(mTagBFP2)以及红色荧光蛋白(mKate2)作为报告基因,证明使用一个crRNA阵列可以同时对三个基因进行抑制(图5)。
为了利用CRISPR/Cpf1系统实现在转录水平的增强表达(激活),将枯草芽孢杆菌中具有激活作用的转录因子融合到了dCpf1的C端,使用crRNA阵列将其靶向到目标基因的不同位置时可以同时实现激活和抑制(靶向到启动子上为激活,靶向基因编码区的模板链为抑制)(图6)。
对比例1:NgAgo蛋白对基因编辑效率的影响
使用质粒pHT-XC(与pHT-XCR6相比不含NgAgo),只能进行一个基因的完全敲除,部分碱基的突变也只能同时在两处进行,使用靶向三个以上的crRNA阵列时,即使将所需同源臂连接到pcrF11上,转化含有pHT-XC的枯草芽孢杆菌也不会有菌落出现,说明DNA在这些crRNA的引导下被Cpf1切割后,在没有外源蛋白的帮助下很难进行修复。而表达NgAgo后(使用质粒pHT-XCR6),便可以同时进行两个基因的完全敲除和6个基因的部分碱基突变。
对比例2:使用木糖诱导启动子PxylA表达dCpf1对转录调控的影响
除了使用IPTG诱导启动子表达dCpf1进行转录调控外,我们也尝试了使用木糖诱导启动子PxylA来调控dCpf1表达。使用PxylA时,基本没有渗漏表达,但是其抑制强度没有使用Pgrac100强(图7);而且木糖是枯草芽孢杆菌中很常见的一种碳源,为了避免诱导剂被细胞利用之后调控效果被减弱,最终我们选择了使用IPTG诱导启动子Pgrac100表达dCpf1并在其上额外添加了一个阻遏蛋白的结合位点以降低渗漏表达。
对比例3:融合不同转录因子对转录激活和抑制的影响
除了remA以外,我们同样尝试了参考文献(Murayama S,Ishikawa S,ChumsakulO,Ogasawara N,Oshima T.2015.The role ofα-CTD in the genome-widetranscriptional regulation of the Bacillus subtilis cells.Ed.DipankarChatterji.PLoS One 10:e0131588.https://dx.plos.org/10.1371/journal.pone.0131588.)中报道的枯草芽孢杆菌中其他的具有激活作用的转录因子,以及在大肠杆菌里具有很好效果的转录因子soxS(详见参考文献:Dong C,Fontana J,Patel A,Carothers JM,Zalatan JG.2018.Synthetic CRISPR-Cas gene activators fortranscriptional reprogramming in bacteria.Nat.Commun.9.http://dx.doi.org/10.1038/s41467-018-04901-6.)。除remA以外,其他的转录因子融合到dCpf1的C端后均未观察到明显明显的激活作用,而且各别转录因子(如rpoB)还会使dCpf1失去转录抑制的作用(图8)。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。
序列表
<110> 江南大学
<120> 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 14095
<212> DNA
<213> (人工序列)
<400> 1
atgagtgaag taaacctaaa aggaaataca gatgaattag tgtattatcg acagcaaacc 60
actggaaata aaatcgccag gaagagaatc aaaaaaggga aagaagaagt ttattatgtt 120
gctgaaacgg aagagaagat atggacagaa gagcaaataa aaaacttttc tttagacaaa 180
tttggtacgc atatacctta catagaaggt cattatacaa tcttaaataa ttacttcttt 240
gatttttggg gctatttttt aggtgctgaa ggaattgcgc tctatgctca cctaactcgt 300
tatgcatacg gcagcaaaga cttttgcttt cctagtctac aaacaatcgc taaaaaaatg 360
gacaagactc ctgttacagt tagaggctac ttgaaactgc ttgaaaggta cggttttatt 420
tggaaggtaa acgtccgtaa taaaaccaag gataacacag aggaatcccc gatttttaag 480
attagacgta aggttccttt gctttcagaa gaacttttaa atggaaaccc taatattgaa 540
attccagatg acgaggaagc acatgtaaag aaggctttaa aaaaggaaaa agagggtctt 600
ccaaaggttt tgaaaaaaga gcacgatgaa tttgttaaaa aaatgatgga tgagtcagaa 660
acaattaata ttccagaggc cttacaatat gacacaatgt atgaagatat actcagtaaa 720
ggagaaattc gaaaagaaat caaaaaacaa atacctaatc ctacaacatc ttttgagagt 780
atatcaatga caactgaaga ggaaaaagtc gacagtactt taaaaagcga aatgcaaaat 840
cgtgtctcta agccttcttt tgatacctgg tttaaaaaca ctaagatcaa aattgaaaat 900
aaaaattgtt tattacttgt accgagtgaa tttgcatttg aatggattaa gaaaagatat 960
ttagaaacaa ttaaaacagt ccttgaagaa gctggatatg ttttcgaaaa aatcgaacta 1020
agaaaagtgc aataaactgc tgaagtattt cagcagtttt ttttatttag aaatagtgaa 1080
aaaaatataa tcagggaggt atcaatattt aatgagtact gatttaaatt tatttagact 1140
ggaattaata attaacacgt agactaatta aaatttaatg agggataaag aggatacaaa 1200
aatattaatt tcaatcccta ttaaatttta acaagggggg gattaaaatt taattagagg 1260
tttatccaca agaaaagacc ctaataaaat ttttactagg gttataacac tgattaattt 1320
cttaatgggg gagggattaa aatttaatga caaagaaaac aatcttttaa gaaaagcttt 1380
taaaagataa taataaaaag agctttgcga ttaagcaaaa ctctttactt tttcattgac 1440
attatcaaat tcatcgattt caaattgttg ttgtatcata aagttaattc tgttttgcac 1500
aaccttttca ggaatataaa acacatctga ggcttgtttt ataaactcag ggtcgctaaa 1560
gtcaatgtaa cgtagcatat gatatggtat agcttccacc caagttagcc tttctgcttc 1620
ttctgaatgt ttttcatata cttccatggg tatctctaaa tgattttcct catgtagcaa 1680
ggtatgagca aaaagtttat ggaattgata gttcctctct ttttcttcaa cttttttatc 1740
taaaacaaac actttaacat ctgagtcaat gtaagcataa gatgtttttc cagtcataat 1800
ttcaatccca aatcttttag acagaaattc tggacgtaaa tcttttggtg aaagaatttt 1860
tttatgtagc aatatatccg atacagcacc ttctaaaagc gttggtgaat agggcatttt 1920
acctatctcc tctcattttg tggaataaaa atagtcatat tcgtccatct acctatccta 1980
ttatcgaaca gttgaacttt ttaatcaagg atcagtcctt tttttcatta ttcttaaact 2040
gtgctcttaa ctttaacaac tcgatttgtt tttccagatc tcgagggtaa ctagcctcgc 2100
cgatcccgca agaggcccgg cagtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 2160
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 2220
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 2280
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 2340
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 2400
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 2460
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 2520
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 2580
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 2640
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 2700
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 2760
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 2820
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 2880
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 2940
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 3000
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 3060
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 3120
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 3180
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 3240
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 3300
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 3360
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 3420
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 3480
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 3540
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 3600
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 3660
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 3720
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 3780
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 3840
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 3900
ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 3960
ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 4020
ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc atgcttaagt 4080
tattggtatg actggtttta agcgcaaaaa aagttgcttt ttcgtaccta ttaatgtatc 4140
gttttagaaa accgactgta aaaagtacag tcggcattat ctcatattat aaaagccagt 4200
cattaggcct atctgacaat tcctgaatag agttcataaa caatcctgca tgataaccat 4260
cacaaacaga atgatgtacc tgtaaagata gcggtaaata tattgaatta cctttattaa 4320
tgaattttcc tgctgtaata atgggtagaa ggtaattact attattattg atatttaagt 4380
taaacccagt aaatgaagtc catggaataa tagaaagaga aaaagcattt tcaggtatag 4440
gtgttttggg aaacaatttc cccgaaccat tatatttctc tacatcagaa aggtataaat 4500
cataaaactc tttgaagtca ttctttacag gagtccaaat accagagaat gttttagata 4560
caccatcaaa aattgtataa agtggctcta acttatccca ataacctaac tctccgtcgc 4620
tattgtaacc agttctaaaa gctgtatttg agtttatcac ccttgtcact aagaaaataa 4680
atgcagggta aaatttatat ccttcttgtt ttatgtttcg gtataaaaca ctaatatcaa 4740
tttctgtggt tatactaaaa gtcgtttgtt ggttcaaata atgattaaat atctcttttc 4800
tcttccaatt gtctaaatca attttattaa agttcatttg atatgcctcc taaattttta 4860
tctaaagtga atttaggagg cttacttgtc tgctttcttc attagaatca atcctttttt 4920
aaaagtcaat attactgtaa cataaatata tattttaaaa atatcccact ttatccaatt 4980
ttcgtttgtt gaactaatgg gtgctttagt tgaagaataa aagaccacat taaaaaatgt 5040
ggtcttttgt gtttttttaa aggatttgag cgtagcgaaa aatccttttc tttcttatct 5100
tgataataag ggtaactatt gccgatcgtc cattccgaca gcatcgccag tcactatggc 5160
gtgctgctag cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 5220
ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 5280
ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattcgagct 5340
caggccttaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 5400
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 5460
gcgccagggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg 5520
cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat 5580
cctgtttgat ggtggttaac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc 5640
ccactaccga gatatccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc 5700
ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca 5760
tttgcatggt ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg 5820
gctgaatttg attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga 5880
cagaacttaa tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct 5940
ccacgcccag tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt 6000
cagagacatc aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat 6060
cctggtcatc cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt 6120
gcaccgccgt tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg 6180
cacccagttg atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg 6240
ccagactgga ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca 6300
cgcggttggg aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg 6360
cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat 6420
actctgcgac atcgtataac gttactggtt tcatcatcaa aatcgtctcc ctccgtttga 6480
atatttgatt gatcgtaacc agatgaagca ctctttccac tatccctaca gtgttatggc 6540
ttgaacaatc acgaaacaat aattggtacg tacgatcttt cagccgactc aaacatcaaa 6600
tcttacaaat gtagtctttg aaagtattac atatgtaaga tttaaatgca accgtttttt 6660
cggaaggaaa tgatgacctc gtttccaccg gaattagctt ggtaccagct attgtaacat 6720
aatcggtacg ggggtgaaaa agctaacgga aaagggagcg aatggcaaga acgtcccggg 6780
gagctcctaa cttatagggg taacacttaa aaaagaatca ataacgatag aaaccgctcc 6840
taaagcaggt gcattttttc ctaacgaaga aggcaatagt tcacatttat tgtctaaatg 6900
agaatggact ctagaagaaa cttcgttttt aatcgtattt aaaacaatgg gatgagattc 6960
aattatatga tttctcaaga taacagcttc tatatcaaat gtattaagga tattggttaa 7020
tccaattccg atataaaagc caaagttttg aagtgcattt aacatttcta catcattttt 7080
atttgcgcgt tccacaatct cttttcgaga aatattcttt tcttctttag agagcgaagc 7140
cagtaacgct ttttcagaag catataattc ccaacagcct cgatttccac agctgcattt 7200
gggtccatta aaatctatcg tcatatgacc catttcccca gaaaaaccct gaacaccttt 7260
atacaattcg ttgttaataa caagtccagt tccaattccg atattaatac tgatgtaaac 7320
gatgttttca tagttttttg tcataccaaa tactttttca ccgtatgctc ctgcattagc 7380
ttcattttca acaaaaaccg gaacattaaa ctcactctca attaaaaact gcaaatcttt 7440
gatattccaa tttaagttag gcatgaaaat aatttgctga tgacgatcta caaggcctgg 7500
aacacaaatt cctattccga ctagaccata aggggactca ggcatatggg ttacaaaacc 7560
atgaataagt gcaaataaaa tctcttttac ttcactagcg gaagaactag acaagtcaga 7620
agtcttctcg agaataatat ttccttctaa gtcggttaga attccgttaa gatagtcgac 7680
tcctatatca ataccaatcg agtagcctgc attcttatta aaaacaagca ttacaggtct 7740
tctgccgcct ctagattgcc ctgccccaat ttcaaaaata aaatcttttt caagcagtgt 7800
atttacttga gaggagacag tagacttgtt taatcctgta atctcagaga gagttgccct 7860
ggagacaggg gagttcttca aaatttcatc taatattaat ttttgattca ttttttttac 7920
taaagcttga tctgcaattt gaataataac cactcctttg tttatccacc gaactaagtt 7980
ggtgtttttt gaagcttgaa ttagatattt aaaagtatca tatctaatat tataactaaa 8040
ttttctaaaa aaaacattga aataaacatt tattttgtat atgatgagat aaagttagtt 8100
tattggataa acaaactaac tcaattaaga tagttgatgg ataaacttgt tcacttaaat 8160
caaaggggga aatgacaaat ggtccaaact agtgatatct aaaaatcaaa gggggaaatg 8220
ggatccatgt caatttatca agaatttgtt aataaatata gtttaagtaa aactctaaga 8280
tttgagttaa tcccacaggg taaaacactt gaaaacataa aagcaagagg tttgatttta 8340
gatgatgaga aaagagctaa agactacaaa aaggctaaac aaataattga taaatatcat 8400
cagtttttta tagaggagat attaagttcg gtttgtatta gcgaagattt attacaaaac 8460
tattctgatg tttattttaa acttaaaaag agtgatgatg ataatctaca aaaagatttt 8520
aaaagtgcaa aagatacgat aaagaaacaa atatctgaat atataaagga ctcagagaaa 8580
tttaagaatt tgtttaatca aaaccttatc gatgctaaaa aagggcaaga gtcagattta 8640
attctatggc taaagcaatc taaggataat ggtatagaac tatttaaagc caatagtgat 8700
atcacagata tagatgaggc gttagaaata atcaaatctt ttaaaggttg gacaacttat 8760
tttaagggtt ttcatgaaaa tagaaaaaat gtttatagta gcaatgatat tcctacatct 8820
attatttata ggatagtaga tgataatttg cctaaatttc tagaaaataa agctaagtat 8880
gagagtttaa aagacaaagc tccagaagct ataaactatg aacaaattaa aaaagatttg 8940
gcagaagagc taacctttga tattgactac aaaacatctg aagttaatca aagagttttt 9000
tcacttgatg aagtttttga gatagcaaac tttaataatt atctaaatca aagtggtatt 9060
actaaattta atactattat tggtggtaaa tttgtaaatg gtgaaaatac aaagagaaaa 9120
ggtataaatg aatatataaa tctatactca cagcaaataa atgataaaac actcaaaaaa 9180
tataaaatga gtgttttatt taagcaaatt ttaagtgata cagaatctaa atcttttgta 9240
attgataagt tagaagatga tagtgatgta gttacaacga tgcaaagttt ttatgagcaa 9300
atagcagctt ttaaaacagt agaagaaaaa tctattaaag aaacactatc tttattattt 9360
gatgatttaa aagctcaaaa acttgatttg agtaaaattt attttaaaaa tgataaatct 9420
cttactgatc tatcacaaca agtttttgat gattatagtg ttattggtac agcggtacta 9480
gaatatataa ctcaacaaat agcacctaaa aatcttgata accctagtaa gaaagagcaa 9540
gaattaatag ccaaaaaaac tgaaaaagca aaatacttat ctctagaaac tataaagctt 9600
gccttagaag aatttaataa gcatagagat atagataaac agtgtaggtt tgaagaaata 9660
cttgcaaact ttgcggctat tccgatgata tttgatgaaa tagctcaaaa caaagacaat 9720
ttggcacaga tatctatcaa atatcaaaat caaggtaaaa aagacctact tcaagctagt 9780
gcggaagatg atgttaaagc tatcaaggat cttttagatc aaactaataa tctcttacat 9840
aaactaaaaa tatttcatat tagtcagtca gaagataagg caaatatttt agacaaggat 9900
gagcattttt atctagtatt tgaggagtgc tactttgagc tagcgaatat agtgcctctt 9960
tataacaaaa ttagaaacta tataactcaa aagccatata gtgatgagaa atttaagctc 10020
aattttgaga actcgacttt ggctaatggt tgggataaaa ataaagagcc tgacaatacg 10080
gcaattttat ttatcaaaga tgataaatat tatctgggtg tgatgaataa gaaaaataac 10140
aaaatatttg atgataaagc tatcaaagaa aataaaggcg agggttataa aaaaattgtt 10200
tataaacttt tacctggcgc aaataaaatg ttacctaagg ttttcttttc tgctaaatct 10260
ataaaatttt ataatcctag tgaagatata cttagaataa gaaatcattc cacacataca 10320
aaaaatggta gtcctcaaaa aggatatgaa aaatttgagt ttaatattga agattgccga 10380
aaatttatag atttttataa acagtctata agtaagcatc cggagtggaa agattttgga 10440
tttagatttt ctgatactca aagatataat tctatagatg aattttatag agaagttgaa 10500
aatcaaggct acaaactaac ttttgaaaat atatcagaga gctatattga tagcgtagtt 10560
aatcagggta aattgtacct attccaaatc tataataaag atttttcagc ttatagcaaa 10620
gggcgaccaa atctacatac tttatattgg aaagcgctgt ttgatgagag aaatcttcaa 10680
gatgtggttt ataagctaaa tggtgaggca gagctttttt atcgtaaaca atcaatacct 10740
aaaaaaatca ctcacccagc taaagaggca atagctaata aaaacaaaga taatcctaaa 10800
aaagagagtg tttttgaata tgatttaatc aaagataaac gctttactga agataagttt 10860
ttctttcact gtcctattac aatcaatttt aaatctagtg gagctaataa gtttaatgat 10920
gaaatcaatt tattgctaaa agaaaaagca aatgatgttc atatattaag tatagataga 10980
ggtgaaagac atttagctta ctatactttg gtagatggta aaggcaatat catcaaacaa 11040
gatactttca acatcattgg taatgataga atgaaaacaa actaccatga taagcttgct 11100
gcaatagaga aagataggga ttcagctagg aaagactgga aaaagataaa taacatcaaa 11160
gagatgaaag agggctatct atctcaggta gttcatgaaa tagctaagct agttatagag 11220
tataatgcta ttgtggtttt tgaggattta aattttggat ttaaaagagg gcgtttcaag 11280
gtagagaagc aggtctatca aaagttagaa aaaatgctaa ttgagaaact aaactatcta 11340
gttttcaaag ataatgagtt tgataaaact gggggagtgc ttagagctta tcagctaaca 11400
gcaccttttg agacttttaa aaagatgggt aaacaaacag gtattatcta ctatgtacca 11460
gctggtttta cttcaaaaat ttgtcctgta actggttttg taaatcagtt atatcctaag 11520
tatgaaagtg tcagcaaatc tcaagagttc tttagtaagt ttgacaagat ttgttataac 11580
cttgataagg gctattttga gtttagtttt gattataaaa actttggtga caaggctgcc 11640
aaaggcaagt ggactatagc tagctttggg agtagattga ttaactttag aaattcagat 11700
aaaaatcata attgggatac tcgagaagtt tatccaacta aagagttgga gaaattgcta 11760
aaagattatt ctatcgaata tgggcatggc gaatgtatca aagcagctat ttgcggtgag 11820
agcgacaaaa agttttttgc taagctaact agtgtcctaa atactatctt acaaatgcgt 11880
aactcaaaaa caggtactga gttagattat ctaatttcac cagtagcaga tgtaaatggc 11940
aatttctttg attcgcgaca ggcgccaaaa aatatgcctc aagatgctga tgccaatggt 12000
gcttatcata ttgggctaaa aggtctgatg ctactaggta ggatcaaaaa taatcaagag 12060
ggcaaaaaac tcaatttggt tatcaaaaat gaagagtatt ttgagttcgt gcagaatagg 12120
aataactaac tgcagaacgc tcggttgccg ccgggcgttt tttcgtcatc gcggaaaaga 12180
atgatgtaag cgtgaaaaat tttttaaaaa atctcttgac attggaaggg agatatgtta 12240
ttataagaat tgcggaattg tgagcggata acaattccca attaaaggag gtgggatcca 12300
tgcatgcgat gcctggggac gcagatatgt tcattgggat tgcggtctct cggagctacc 12360
ccgaggacgg tgccagcggc cagataaaca ttgccgcgac ggcgaccgcc gtctacaagg 12420
atggaactat cctcggccac tcgtccaccc gaccgcagct cggggagaaa ctacagtcga 12480
cggatgttcg tgacattatg aagaatgcca tcctcggcta ccagcaggtg accggtgagt 12540
cgccgaccca tatcgtcatc caccgtgcgg gcttcatgaa cgaagacctc gaccccgcca 12600
cggaattcct caacgaacaa ggcgtcgagt acgacatcgt cgaaatccgc aagcagcccc 12660
agacacgcct gctggcagtc tccgatgtgc agtacgatac gcctgtgaag agcatcgccg 12720
ctatcaacca gaacgagcca cgggcaacgg tcgccacctt cggcgcaccc gaatacttag 12780
cgacacgcga tggaggcggc cttccccgcc caatccaaat tgaacgagtc gccggcgaaa 12840
ccgacatcga gacgctcact cgccaagtct atctgctctc ccagtcgcat atccaggtcc 12900
ataactcgac tgcgcgccta cccatcacca ccgcatacgc cgaccaggca agtactcacg 12960
cgaccaaggg ttacctcgtc cagaccggag cgttcgagtc taatgtcgga ttcctctaat 13020
cctctagagt cgacgtcccc ggggcagccc gcctaatgag cgggcttttt tcacgtcacg 13080
cgtccatgga gatctttgtc tgcaactgaa aagtttatac cttacctgga acaaatggtt 13140
gaaacatacg aggctaatat cggcttatta ggaatagtcc ctgtactaat aaaatcaggt 13200
ggatcagttg atcagtatat tttggacgaa gctcggaaag aatttggaga tgacttgctt 13260
aattccacaa ttaaattaag ggaaagaata aagcgatttg atgttcaagg aatcacggaa 13320
gaagatactc atgataaaga agctctaaaa ctattcaata accttacaat ggaattgatc 13380
gaaagggtgg aaggttaatg gtacgaaaat taggggatct acctagaaag ccacaaggcg 13440
ataggtcaag cttaaagaac ccttacatgg atcttacaga ttctgaaagt aaagaaacaa 13500
cagaggttaa acaaacagaa ccaaaaagaa aaaaagcatt gttgaaaaca atgaaagttg 13560
atgtttcaat ccataataag attaaatcgc tgcacgaaat tctggcagca tccgaaggga 13620
attcatatta cttagaggat actattgaga gagctattga taagatggtt gagacattac 13680
ctgagagcca aaaaactttt tatgaatatg aattaaaaaa aagaaccaac aaaggctgag 13740
acagactcca aacgagtctg tttttttaaa aaaaatatta ggagcattga atatatatta 13800
gagaattaag aaagacatgg gaataaaaat attttaaatc cagtaaaaat atgataagat 13860
tatttcagaa tatgaagaac tctgtttgtt tttgatgaaa aaacaaacaa aaaaaatcca 13920
cctaacggaa tctcaattta actaacagcg gccaaactga gaagttaaat ttgagaaggg 13980
gaaaaggcgg atttatactt gtatttaact atctccattt taacatttta ttaaacccca 14040
tacaagtgaa aatcctcttt tacactgttc ctttaggtga tcgcggaggg acatt 14095
<210> 2
<211> 4431
<212> DNA
<213> (人工序列)
<400> 2
ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 60
caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 120
cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 180
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 240
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 300
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 360
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 420
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 480
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 540
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 600
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 660
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 720
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 780
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 840
cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 900
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 960
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1020
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 1080
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 1140
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcatgcggt attttctcct 1200
tacgacaacg tcttattaac gttgatataa tttaaatttt atttgacaaa aatgggctcg 1260
tgttgtacaa taaatgtaga ggtagagacg cgaggtctaa gaactttaaa taatttctac 1320
tgttgtagat agagaccgtg aagttaataa ggtctcaaat ttctactgtt gtagatcgtc 1380
tctgaactga ttcaagcaag cttaaaccca gctcaatgag ctgggttttt tgtttgtttt 1440
ttcaaactta gttagcttgg ccgaattcgt cgactctaga ctgcagatcg tcgaacggca 1500
gatcagaatt ttgtaataaa aaaagagcct gctcattaca ctgcgggctc tttttcatgg 1560
tcagaagacg ggtaaccaag ataacaaaga atacaagaaa atatttacaa aaaatcaatt 1620
taacaattcc ttaaaacatg caggaattga cgatttaaac aatattagct ttgaacaatt 1680
cttatctctt ttcaatagct ataaattatt taataagtaa gttaagggat gcataaactg 1740
catcccttaa cttgtttttc gtgtgcccat tttttgtgaa tcgattatgt cttttgcgca 1800
gtcggcttaa accagttttc gctggtgcga aaaaagagtg tcttgtgaca ctcttaaatt 1860
caaaatctat cggtcagatt tataccgatt tgattttata tattcttgaa taacatacgc 1920
cgagttatca cataaaagcg ggaaccaatc atcaaattta aacttcattg cataatccat 1980
taaactctta aattctacga ttccttgttc atcaataaac tcaatcattt ctttaattaa 2040
tttatatcta tctgttgttg ttttctttaa taattcatca acatctacac cgccataaac 2100
tatcatatct tctttttgat atttaaattt attaggatcg tccatgtgaa gcatatatct 2160
cacaagacct ttcacacttc ctgcaatctg cggaatagtc gcattcaatt cttctgtaat 2220
tatttttatc tgttcataag atttattacc ctcatacatc actagaatat gataatgctc 2280
ttttttcatc ctatcttctg tatcagtatc cctatcatgt aatggagaca ctacaaattg 2340
aatgtgtaac tcttttaaat actctaacca ctcggctttt gctgattctg gatataaaac 2400
aaatgtccaa ttacgtcctc ttgaattttt cttgttttca gtttctttta ttacattttc 2460
gctcatgata taataacggt gctaatacat ttaacaaaat ttagtcatag ataggcagca 2520
tgccagtgct gtctatcttt ttttgtttaa aatgcaccgt attcctcctt tgcatatttt 2580
tttattagaa taccggttgc atctgatttg ctaatattat atttttcttt gattctattt 2640
aatatctcat tttcttctgt tgtaagtctt aaagtaacag caactttttt ctcttctttt 2700
ctatctacaa ccatcactgt acctcccaac atctgttttt ttcactttaa cataaaaaac 2760
aaccttttaa cattaaaaac ccaatattta tttatttgtt tggacaatgg acaatggaca 2820
cctagggggg aggtcgtagt acccccctat gttttctccc ctaaataacc ccaaaaatct 2880
aagaaaaaaa gacctcaaaa aggtctttaa ttaacatctc aaatttcgca tttattccaa 2940
tttccttttt gcgtgtgatg cgctgcgtcc attaaaaatc ctagagcttt gcaaccgaaa 3000
gttaatagct gtcgctacta ctttcgctta cgctctaagt atattttaag gactgtcaca 3060
cgcaaaaagt tttctcggca taaaagtacc tctacatctc taaatcgtct gtacgctgtt 3120
tctcacgctt tctatcgacc ttctggacct tagacgtcag gtggcactta gaaaaactca 3180
tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc atatttttga 3240
aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag gatggcaaga 3300
tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat taatttcccc 3360
tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga atccggtgag 3420
aatggcaaaa gtttatgcat ttctttccag acttgttcaa caggccagcc attacgctcg 3480
tcatcaaaat cactcgcatc aaccaaaccg ttattcattc gtgattgcgc ctgagcgaga 3540
cgaaatacgc gatcgctgtt aaaaggacaa ttacaaacag gaatcgaatg caaccggcgc 3600
aggaacactg ccagcgcatc aacaatattt tcacctgaat caggatattc ttctaatacc 3660
tggaatgctg ttttcccagg gatcgcagtg gtgagtaacc atgcatcatc aggagtacgg 3720
ataaaatgct tgatggtcgg aagaggcata aattccgtca gccagtttag tctgaccatc 3780
tcatctgtaa catcattggc aacgctacct ttgccatgtt tcagaaacaa ctctggcgca 3840
tcgggcttcc catacaatcg atagattgtc gcacctgatt gcccgacatt atcgcgagcc 3900
catttatacc catataaatc agcatccatg ttggaattta atcgcggcct agagcaagac 3960
gtttcccgtt gaatatggct cattggatcc ttcctccttt aattgggtaa gttaattata 4020
tcacatgcta aattcagtgt caaggaggcg ctcgccagtc gattggctga gctcatgaag 4080
ttcctattcc gaagttccgc gaacctttaa gacctttctt ttttttacga gaaaaaagaa 4140
acaaaaaaac ctgccctctg ccacctcagc aaaggggggt tttgctctcg tgctcgttta 4200
aaaatcagca agggacaggt agtatttttt gagaagatca ctcaaaaaat ctccaccttt 4260
aaacccttgc caatttttat tttgtccgtt ttgtctagct taccgaaagc cagactcagc 4320
aagaataaaa tttttattgt ctttcggttt tctagtgtaa cggacaaaac cactcaaaat 4380
aaaaaagata caagagtgga ctctcgtatc ttttattcag caatcgcgcc c 4431
<210> 3
<211> 10415
<212> DNA
<213> (人工序列)
<400> 3
tcgagttcat gtgcagctcc atcagcaaaa ggggatgata agtttatcac caccgactat 60
ttgcaacagt gccgttgatc gtgctatgat cgactgatgt catcagcggt ggagtgcaat 120
gtcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 180
atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 240
ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 300
gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 360
agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 420
cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 480
ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 540
gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 600
caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 660
gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 720
ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 780
tatcagcccg tcatacttga agctagacag gcttatcttg gacaagaaga agatcgcttg 840
gcctcgcgcg cagatcagtt ggaagaattt gtccactacg tgaaaggcga gatcaccaag 900
gtagtcggca aataagatgc cgctcgccag tcgattggct gagctcatga agttcctatt 960
ccgaagttcc gcgaacgcgt aaaggatcta ggtgaagatc ctttttgata atctcatgac 1020
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1080
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1140
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1200
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1260
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1320
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1380
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1440
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1500
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1560
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1620
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1680
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1740
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1800
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1860
gcgcctgatg cggtattttc tccttacggg aattccatat ggattccgtg atgtcaaagc 1920
ttgaaaaaac gcacgtaaca aaagcaaaat ttatgctcca tgggggagac tacaaccccg 1980
atcagtggct ggatcggccc gatattttag ctgacgatat caaactgatg aagctttctc 2040
atacgaatac gttttctgtc ggcatttttg catggagcgc acttgagccg gaggagggcg 2100
tatatcaatt tgaatggctg gatgatattt ttgagcggat tcacagtata ggcggccggg 2160
tcatattagc aacgccgagc ggagcccgtc cggcctggct gtcgcaaacc tatccggaag 2220
ttttgcgcgt caatgcctcc cgcgtcaaac agctgcacgg cggaaggcac aaccactgcc 2280
tcacatctaa agtctaccga gaaaaaacac ggcacatcaa ccgcttatta gcagaacgat 2340
acggacatca cccggcgctg ttaatgtggc acatttcaaa cgaatacggg ggagattgcc 2400
actgtgattt atgccagcat gctttccggg agtggctgaa atcgaaatat gacaacagcc 2460
tcaagacatt gaaccatgcg tggtggaccc ctttttggag ccatacgttc aatgactggt 2520
cacaaattga aagcccttcg ccgatcggtg aaaatggctt gcatggcctg aatttagatt 2580
ggcgccggtt cgtcaccgat caaacgattt cgttttatga aaatgaaatc attccgctga 2640
aagaattgac gcctgatatc cctatcacaa cgaattttat ggctgacaca ccggatttga 2700
tcccgtatac cgttcgtata gcatacatta tacgaagtta tgccatagtg actggcgatg 2760
ctgtcggaat ggacgacggc aatagttacc cttattatca agataagaaa gaaaaggatt 2820
tttcgctacg ctcaaatcct ttaaaaaaac acaaaagacc acatttttta atgtggtctt 2880
ttattcttca actaaagcac ccattagttc aacaaacgaa aattggataa agtgggatat 2940
ttttaaaata tatatttatg ttacagtaat attgactttt aaaaaaggat tgattctaat 3000
gaagaaagca gacaagtaag cctcctaaat tcactttaga taaaaattta ggaggcatat 3060
caaatgaact ttaataaaat tgatttagac aattggaaga gaaaagagat atttaatcat 3120
tatttgaacc aacaaacgac ttttagtata accacagaaa ttgatattag tgttttatac 3180
cgaaacataa aacaagaagg atataaattt taccctgcat ttattttctt agtgacaagg 3240
gtgataaact caaatacagc ttttagaact ggttacaata gcgacggaga gttaggttat 3300
tgggataagt tagagccact ttatacaatt tttgatggtg tatctaaaac attctctggt 3360
atttggactc ctgtaaagaa tgacttcaaa gagttttatg atttatacct ttctgatgta 3420
gagaaatata atggttcggg gaaattgttt cccaaaacac ctatacctga aaatgctttt 3480
tctctttcta ttattccatg gacttcattt actgggttta acttaaatat caataataat 3540
agtaattacc ttctacccat tattacagca ggaaaattca ttaataaagg taattcaata 3600
tatttaccgc tatctttaca ggtacatcat tctgtttgtg atggttatca tgcaggattg 3660
tttatgaact ctattcagga attgtcagat aggcctaatg actggctttt ataatatgag 3720
ataatgccga ctgtactttt tacagtcggt tttctaacga tacattaata ggtacgaaaa 3780
agcaactttt tttgcgctta aaaccagtca taccaataaa taacttcgta tagcatacat 3840
tatacgaacg gtacaagcaa gcttaaaccc agctcaatga gctgggtttt ttgtttgttg 3900
cagcaatggc aagaacgtcc cgggcggagc tcaggcctta actcacatta attgcgttgc 3960
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4020
aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg tggtttttct tttcaccagt 4080
gagacgggca acagctgatt gcccttcacc gcctggccct gagagagttg cagcaagcgg 4140
tccacgctgg tttgccccag caggcgaaaa tcctgtttga tggtggttaa cggcgggata 4200
taacatgagc tgtcttcggt atcgtcgtat cccactaccg agatatccgc accaacgcgc 4260
agcccggact cggtaatggc gcgcattgcg cccagcgcca tctgatcgtt ggcaaccagc 4320
atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg tttgttgaaa accggacatg 4380
gcactccagt cgccttcccg ttccgctatc ggctgaattt gattgcgagt gagatattta 4440
tgccagccag ccagacgcag acgcgccgag acagaactta atgggcccgc taacagcgcg 4500
atttgctggt gacccaatgc gaccagatgc tccacgccca gtcgcgtacc gtcttcatgg 4560
gagaaaataa tactgttgat gggtgtctgg tcagagacat caagaaataa cgccggaaca 4620
ttagtgcagg cagcttccac agcaatggca tcctggtcat ccagcggata gttaatgatc 4680
agcccactga cgcgttgcgc gagaagattg tgcaccgccg ttttacaggc ttcgacgccg 4740
cttcgttcta ccatcgacac caccacgctg gcacccagtt gatcggcgcg agatttaatc 4800
gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg aggtggcaac gccaatcagc 4860
aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg gaatgtaatt cagctccgcc 4920
atcgccgctt ccactttttc ccgcgttttc gcagaaacgt ggctggcctg gttcaccacg 4980
cgggaaacgg tctgataaga gacaccggca tactctgcga catcgtataa cgttactggt 5040
ttcatcaaaa tcgtctccct ccgtttgaat atttgattga tcgtaaccag atgaagcact 5100
ctttccacta tccctacagt gttatggctt gaacaatcac gaaacaataa ttggtacgta 5160
cgatctttca gccgactcaa acatcaaatc ttacaaatgt agtctttgaa agtattacat 5220
atgtaagatt taaatgcaac cgttttttcg gaaggaaatg atgacctcgt ttccaccgga 5280
attagcttgg taccagctat tgtaacataa tcggtacggg ggtgaaaaag ctaacggaaa 5340
agggagcgga aaagaatgat gtaagcgtga aaaatttttt aaaaaatctc ttgacattgg 5400
aagggagata tgttattata agaattgcgg aattgtgagc ggataacaat tcataattgt 5460
gagcggataa caattcaacc ccaaaggagg tgggatccat gtcaatttat caagaatttg 5520
ttaataaata tagtttaagt aaaactctaa gatttgagtt aatcccacag ggtaaaacac 5580
ttgaaaacat aaaagcaaga ggtttgattt tagatgatga gaaaagagct aaagactaca 5640
aaaaggctaa acaaataatt gataaatatc atcagttttt tatagaggag atattaagtt 5700
cggtttgtat tagcgaagat ttattacaaa actattctga tgtttatttt aaacttaaaa 5760
agagtgatga tgataatcta caaaaagatt ttaaaagtgc aaaagatacg ataaagaaac 5820
aaatatctga atatataaag gactcagaga aatttaagaa tttgtttaat caaaacctta 5880
tcgatgctaa aaaagggcaa gagtcagatt taattctatg gctaaagcaa tctaaggata 5940
atggtataga actatttaaa gccaatagtg atatcacaga tatagatgag gcgttagaaa 6000
taatcaaatc ttttaaaggt tggacaactt attttaaggg ttttcatgaa aatagaaaaa 6060
atgtttatag tagcaatgat attcctacat ctattattta taggatagta gatgataatt 6120
tgcctaaatt tctagaaaat aaagctaagt atgagagttt aaaagacaaa gctccagaag 6180
ctataaacta tgaacaaatt aaaaaagatt tggcagaaga gctaaccttt gatattgact 6240
acaaaacatc tgaagttaat caaagagttt tttcacttga tgaagttttt gagatagcaa 6300
actttaataa ttatctaaat caaagtggta ttactaaatt taatactatt attggtggta 6360
aatttgtaaa tggtgaaaat acaaagagaa aaggtataaa tgaatatata aatctatact 6420
cacagcaaat aaatgataaa acactcaaaa aatataaaat gagtgtttta tttaagcaaa 6480
ttttaagtga tacagaatct aaatcttttg taattgataa gttagaagat gatagtgatg 6540
tagttacaac gatgcaaagt ttttatgagc aaatagcagc ttttaaaaca gtagaagaaa 6600
aatctattaa agaaacacta tctttattat ttgatgattt aaaagctcaa aaacttgatt 6660
tgagtaaaat ttattttaaa aatgataaat ctcttactga tctatcacaa caagtttttg 6720
atgattatag tgttattggt acagcggtac tagaatatat aactcaacaa atagcaccta 6780
aaaatcttga taaccctagt aagaaagagc aagaattaat agccaaaaaa actgaaaaag 6840
caaaatactt atctctagaa actataaagc ttgccttaga agaatttaat aagcatagag 6900
atatagataa acagtgtagg tttgaagaaa tacttgcaaa ctttgcggct attccgatga 6960
tatttgatga aatagctcaa aacaaagaca atttggcaca gatatctatc aaatatcaaa 7020
atcaaggtaa aaaagaccta cttcaagcta gtgcggaaga tgatgttaaa gctatcaagg 7080
atcttttaga tcaaactaat aatctcttac ataaactaaa aatatttcat attagtcagt 7140
cagaagataa ggcaaatatt ttagacaagg atgagcattt ttatctagta tttgaggagt 7200
gctactttga gctagcgaat atagtgcctc tttataacaa aattagaaac tatataactc 7260
aaaagccata tagtgatgag aaatttaagc tcaattttga gaactcgact ttggctaatg 7320
gttgggataa aaataaagag cctgacaata cggcaatttt atttatcaaa gatgataaat 7380
attatctggg tgtgatgaat aagaaaaata acaaaatatt tgatgataaa gctatcaaag 7440
aaaataaagg cgagggttat aaaaaaattg tttataaact tttacctggc gcaaataaaa 7500
tgttacctaa ggttttcttt tctgctaaat ctataaaatt ttataatcct agtgaagata 7560
tacttagaat aagaaatcat tccacacata caaaaaatgg tagtcctcaa aaaggatatg 7620
aaaaatttga gtttaatatt gaagattgcc gaaaatttat agatttttat aaacagtcta 7680
taagtaagca tccggagtgg aaagattttg gatttagatt ttctgatact caaagatata 7740
attctataga tgaattttat agagaagttg aaaatcaagg ctacaaacta acttttgaaa 7800
atatatcaga gagctatatt gatagcgtag ttaatcaggg taaattgtac ctattccaaa 7860
tctataataa agatttttca gcttatagca aagggcgacc aaatctacat actttatatt 7920
ggaaagcgct gtttgatgag agaaatcttc aagatgtggt ttataagcta aatggtgagg 7980
cagagctttt ttatcgtaaa caatcaatac ctaaaaaaat cactcaccca gctaaagagg 8040
caatagctaa taaaaacaaa gataatccta aaaaagagag tgtttttgaa tatgatttaa 8100
tcaaagataa acgctttact gaagataagt ttttctttca ctgtcctatt acaatcaatt 8160
ttaaatctag tggagctaat aagtttaatg atgaaatcaa tttattgcta aaagaaaaag 8220
caaatgatgt tcatatatta agtatagcta gaggtgaaag acatttagct tactatactt 8280
tggtagatgg taaaggcaat atcatcaaac aagatacttt caacatcatt ggtaatgata 8340
gaatgaaaac aaactaccat gataagcttg ctgcaataga gaaagatagg gattcagcta 8400
ggaaagactg gaaaaagata aataacatca aagagatgaa agagggctat ctatctcagg 8460
tagttcatga aatagctaag ctagttatag agtataatgc tattgtggtt tttgaggatt 8520
taaattttgg atttaaaaga gggcgtttca aggtagagaa gcaggtctat caaaagttag 8580
aaaaaatgct aattgagaaa ctaaactatc tagttttcaa agataatgag tttgataaaa 8640
ctgggggagt gcttagagct tatcagctaa cagcaccttt tgagactttt aaaaagatgg 8700
gtaaacaaac aggtattatc tactatgtac cagctggttt tacttcaaaa atttgtcctg 8760
taactggttt tgtaaatcag ttatatccta agtatgaaag tgtcagcaaa tctcaagagt 8820
tctttagtaa gtttgacaag atttgttata accttgataa gggctatttt gagtttagtt 8880
ttgattataa aaactttggt gacaaggctg ccaaaggcaa gtggactata gctagctttg 8940
ggagtagatt gattaacttt agaaattcag ataaaaatca taattgggat actcgagaag 9000
tttatccaac taaagagttg gagaaattgc taaaagatta ttctatcgaa tatgggcatg 9060
gcgaatgtat caaagcagct atttgcggtg agagcgacaa aaagtttttt gctaagctaa 9120
ctagtgtcct aaatactatc ttacaaatgc gtaactcaaa aacaggtact gagttagatt 9180
atctaatttc accagtagca gatgtaaatg gcaatttctt tgattcgcga caggcgccaa 9240
aaaatatgcc tcaagatgct gatgccaatg gtgcttatca tattgggcta aaaggtctga 9300
tgctactagg taggatcaaa aataatcaag agggcaaaaa actcaatttg gttatcaaaa 9360
atgaagagta ttttgagttc gtgcagaata ggaataacgg tggcggtgga agcacgatta 9420
aactgattaa tatcggattt ggcaatatca tctccgccaa tcggatgatt tcgattgtca 9480
gcccggagtc tgcgccaatc aaacggatga ttcaggatgc aagagaccgc ggaatgctaa 9540
ttgacgctac atacggacga agaacccgtg cagttgtcgt catggatagt gatcacatta 9600
tcttatctgc cgtccagcct gagacagttg cacacagact ttctgttaaa gaagaaatta 9660
tggatgaagg gcaggggtaa ctgcagaacg ctcggttgcc gccgggcgtt ttttcgtcat 9720
cacgaaagaa caagactttt caccatataa actgctgatc gtcccgatgc tgtatttaat 9780
cagcgaggac accgtttccc gtttaaaagc gtttacggct gacggcggca ccttagtcat 9840
gacgtatatc agcggggttg tgaatgagca tgacttaaca tacacaggcg gatggcatcc 9900
ggatcttcaa gctatatttg gagttgagcc tcttgaaacg gacaccctgt atccgaagga 9960
tcgaaacgct gtcagctacc gcagccaaat atatgaaatg aaggattatg caaccgtgat 10020
tgatgtaaag acagcttcag tggaagcggt gtatcaagaa gatttttatg cgcgcacgcc 10080
agcggtcaca agccatgagt atcagcaggg caaggcgtat tttatcggcg cgcgtttgga 10140
ggatcaattt cagcgtgatt tctatgaggg tctgatcaca gacctgtctc tctctccagt 10200
ttttccggtt cggcacggaa aaggcgtctc cgtacaagcg aggcaggatc aggacaatga 10260
ttatattttt gtcatgaatt tcacggaaga aaaacagctg gtcacgtttg atcagagtgt 10320
gaaggacata atgacaggag acatattgtc aggcgacctg acgatggaaa agtatgaagt 10380
gagaattgtc gtaaacacac attagggggt acccc 10415
<210> 4
<211> 5871
<212> DNA
<213> (人工序列)
<400> 4
tcgagttcat gtgcagctcc atcagcaaaa ggggatgata agtttatcac caccgactat 60
ttgcaacagt gccgttgatc gtgctatgat cgactgatgt catcagcggt ggagtgcaat 120
gtcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 180
atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 240
ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 300
gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 360
agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 420
cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 480
ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 540
gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 600
caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 660
gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 720
ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 780
tatcagcccg tcatacttga agctagacag gcttatcttg gacaagaaga agatcgcttg 840
gcctcgcgcg cagatcagtt ggaagaattt gtccactacg tgaaaggcga gatcaccaag 900
gtagtcggca aataagatgc cgctcgccag tcgattggct gagctcatga agttcctatt 960
ccgaagttcc gcgaacgcgt aaaggatcta ggtgaagatc ctttttgata atctcatgac 1020
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1080
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1140
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1200
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1260
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1320
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1380
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1440
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1500
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1560
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1620
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1680
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1740
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1800
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1860
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatgctg 1920
gatccgcgat gtttgcaaaa cgattcaaaa cctctttact gccgttattc gctggatttt 1980
tattgctgtt tcatttggtt ctggcaggac cggcggctgc gagtgctgaa acggcgaaca 2040
aatcgaatga gcttacagca ccgtcgatca aaagcggaac cattcttcat gcatggaatt 2100
ggtcgttcaa tacgttaaaa cacaatatga aggatattca tgatgcagga tatacagcca 2160
ttcagacatc tccgattaac caagtaaagg aagggaatca aggagataaa agcatgtcga 2220
actggtactg gctgtatcag ccgacatcgt atcaaattgg caaccgttac ttaggtactg 2280
aacaagaatt taaagaaatg tgtgcagccg ctgaagaata tggcataaag gtcattgttg 2340
acgcggtcat caatcatacc accagtgatt atgccgcgat ttccaatgag gttaagagta 2400
ttccaaactg gacacatgga aacacacaaa ttaaaaactg gtctgatcga tgggatgtca 2460
cgcagaacat gccatggcat gagattctac cgttcgtata gcatacatta tacgaagtta 2520
tcttgatatg gctttttata tgtgttactc tacatacaga aaggaggaac taaacatggc 2580
caagttgacc agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt 2640
ctggaccgac cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt 2700
ccgggacgac gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac 2760
cctggcctgg gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt 2820
gtccacgaac ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg 2880
ggggcgggag ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga 2940
gcaggactga ataacttcgt atagcataca ttatacgaac ggtaaatcgt cgacctgcag 3000
gccaagcaag cttaaaccca gctcaatgag ctgggttttt tgtttgttgc agcaatggca 3060
agaacgtccc gggcggagct caggccttaa ctcacattaa ttgcgttgcg ctcactgccc 3120
gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 3180
agaggcggtt tgcgtattgg gcgccagggt ggtttttctt ttcaccagtg agacgggcaa 3240
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 3300
ttgccccagc aggcgaaaat cctgtttgat ggtggttaac ggcgggatat aacatgagct 3360
gtcttcggta tcgtcgtatc ccactaccga gatatccgca ccaacgcgca gcccggactc 3420
ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg 3480
aacgatgccc tcattcagca tttgcatggt ttgttgaaaa ccggacatgg cactccagtc 3540
gccttcccgt tccgctatcg gctgaatttg attgcgagtg agatatttat gccagccagc 3600
cagacgcaga cgcgccgaga cagaacttaa tgggcccgct aacagcgcga tttgctggtg 3660
acccaatgcg accagatgct ccacgcccag tcgcgtaccg tcttcatggg agaaaataat 3720
actgttgatg ggtgtctggt cagagacatc aagaaataac gccggaacat tagtgcaggc 3780
agcttccaca gcaatggcat cctggtcatc cagcggatag ttaatgatca gcccactgac 3840
gcgttgcgcg agaagattgt gcaccgccgt tttacaggct tcgacgccgc ttcgttctac 3900
catcgacacc accacgctgg cacccagttg atcggcgcga gatttaatcg ccgcgacaat 3960
ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg ccaatcagca acgactgttt 4020
gcccgccagt tgttgtgcca cgcggttggg aatgtaattc agctccgcca tcgccgcttc 4080
cactttttcc cgcgttttcg cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt 4140
ctgataagag acaccggcat actctgcgac atcgtataac gttactggtt tcatcaaaat 4200
cgtctccctc cgtttgaata tttgattgat cgtaaccaga tgaagcactc tttccactat 4260
ccctacagtg ttatggcttg aacaatcacg aaacaataat tggtacgtac gatctttcag 4320
ccgactcaaa catcaaatct tacaaatgta gtctttgaaa gtattacata tgtaagattt 4380
aaatgcaacc gttttttcgg aaggaaatga tgacctcgtt tccaccggaa ttagcttggt 4440
accagctatt gtaacataat cggtacgggg gtgaaaaagc taacggaaaa gggagcggaa 4500
aagaatgatg taagcgtgaa aaatttttta aaaaatctct tgacattgga agggagatat 4560
gttattataa gaattgcgga attgtgagcg gataacaatt cccaattaga ggtagagacg 4620
cgaggtctaa gaactttaaa taatttctac tgttgtagat agagaccgtg aagttaataa 4680
ggtctcaaat ttctactgtt gtagatcgtc tctgaactga tttaaagagg cttcaaagcc 4740
ttgctgtact tgaaaacagg ctgtgaggcc tgttttttta ttaatccttt tcaaacttag 4800
ttagcttggc gtcgacatgg atgagcgatg atgatatccg tttaggctgg gcggtgatag 4860
cttctcgttc aggcagtacg cctcttttct tttccagacc tgagggaggc ggaaatggtg 4920
tgaggttccc ggggaaaagc caaataggcg atcgcgggag tgctttattt gaagatcagg 4980
ctatcactgc ggtcaataga tttcacaatg tgatggctgg acagcctgag gaactctcga 5040
acccgaatgg aaacaaccag atatttatga atcagcgcgg ctcacatggc gttgtgctgg 5100
caaatgcagg ttcatcctct gtctctatca atacggcaac aaaattgcct gatggcaggt 5160
atgacaataa agctggagcg ggttcatttc aagtgaacga tggtaaactg acaggcacga 5220
tcaatgccag gtctgtagct gtgctttatc ctgatgatat tgcaaaagcg cctcatgttt 5280
tccttgagaa ttacaaaaca ggtgtaacac attctttcaa tgatcaactg acgattacct 5340
tgcgtgcaga tgcgaataca acaaaagccg tttatcaaat caataatgga ccagagacgg 5400
cgtttaagga tggagatcaa ttcacaatcg gaaaaggaga tccatttggc aaaacataca 5460
ccatcatgtt aaaaggaacg aacagtgatg gtgtaacgag gaccgagaaa tacagttttg 5520
ttaaaagaga tccagcgtcg gccaaaacca tcggctatca aaatccgaat cattggagcc 5580
aggtaaatgc ttatatctat aaacatgatg ggagccgagt aattgaattg accggatctt 5640
ggcctggaaa accaatgact aaaaatgcag acggaattta cacgctgacg ctgcctgcgg 5700
acacggatac aaccaacgca aaagtgattt ttaataatgg cagcgcccaa gtgcccggtc 5760
agaatcagcc tggctttgat tacgtgctaa atggtttata taatgactcg ggcttaagcg 5820
gttctcttcc ccattgaccc aagcttagat ctattaccct gttatcccta c 5871
<210> 5
<211> 239
<212> PRT
<213> (人工序列)
<400> 5
Met His Ala Met Pro Gly Asp Ala Asp Met Phe Ile Gly Ile Ala Val
1 5 10 15
Ser Arg Ser Tyr Pro Glu Asp Gly Ala Ser Gly Gln Ile Asn Ile Ala
20 25 30
Ala Thr Ala Thr Ala Val Tyr Lys Asp Gly Thr Ile Leu Gly His Ser
35 40 45
Ser Thr Arg Pro Gln Leu Gly Glu Lys Leu Gln Ser Thr Asp Val Arg
50 55 60
Asp Ile Met Lys Asn Ala Ile Leu Gly Tyr Gln Gln Val Thr Gly Glu
65 70 75 80
Ser Pro Thr His Ile Val Ile His Arg Ala Gly Phe Met Asn Glu Asp
85 90 95
Leu Asp Pro Ala Thr Glu Phe Leu Asn Glu Gln Gly Val Glu Tyr Asp
100 105 110
Ile Val Glu Ile Arg Lys Gln Pro Gln Thr Arg Leu Leu Ala Val Ser
115 120 125
Asp Val Gln Tyr Asp Thr Pro Val Lys Ser Ile Ala Ala Ile Asn Gln
130 135 140
Asn Glu Pro Arg Ala Thr Val Ala Thr Phe Gly Ala Pro Glu Tyr Leu
145 150 155 160
Ala Thr Arg Asp Gly Gly Gly Leu Pro Arg Pro Ile Gln Ile Glu Arg
165 170 175
Val Ala Gly Glu Thr Asp Ile Glu Thr Leu Thr Arg Gln Val Tyr Leu
180 185 190
Leu Ser Gln Ser His Ile Gln Val His Asn Ser Thr Ala Arg Leu Pro
195 200 205
Ile Thr Thr Ala Tyr Ala Asp Gln Ala Ser Thr His Ala Thr Lys Gly
210 215 220
Tyr Leu Val Gln Thr Gly Ala Phe Glu Ser Asn Val Gly Phe Leu
225 230 235

Claims (8)

1.一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,包括质粒pHT-XCR6、质粒pcrF11、质粒pLCg6-dCpf1-remA和质粒pcra3;所述的质粒pHT-XCR6和质粒pcrF11用于基因编辑;所述的质粒pLCg6-dCpf1-remA和质粒pcra3用于表达调控;
所述的质粒pHT-XCR6的核苷酸序列如SEQ ID NO.1所示,质粒pcrF11的核苷酸序列如SEQ ID NO.2所示;所述的质粒pLCg6-dCpf1-remA的核苷酸序列如SEQ ID NO.3所示,质粒pcra3的核苷酸序列如SEQ ID NO.4所示。
2.根据权利要求1所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的质粒pHT-XCR6为Cpf1表达载体,包含Cpf1基因和NgAgo蛋白的编码基因,所述的NgAgo蛋白的氨基酸序列如SEQ ID NO.5所示。
3.根据权利要求2所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的NgAgo蛋白的编码基因通过启动子P grac100 调控表达。
4.根据权利要求1所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的质粒pcrF11为crRNA阵列表达载体,包括crRNA阵列插入区和同源臂插入区;所述的crRNA阵列插入区设置在启动子下游,用于插入要表达的crRNA阵列;所述的同源臂插入区包含EcoRI,SalI,XbaI和PstI四个酶切位点,用于插入基因编辑中所需的同源臂。
5.根据权利要求1所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的质粒pLCg6-dCpf1-remA为dCpf1整合表达载体,包括枯草芽孢杆菌lacA基因同源臂、DNA酶活失活的Cpf1突变体dCpf1,以及融合在dCpf1的C端的枯草芽孢杆菌的转录激活因子remA。
6.根据权利要求5所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的DNA酶活失活的Cpf1突变体dCpf1通过启动子P grac100 调控表达;所述的启动子后还包括阻遏蛋白lacI的结合位点lacO。
7.根据权利要求1所述的一种基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统,其特征在于,所述的质粒pcra3为crRNA阵列表达载体,包括枯草芽孢杆菌amyE基因的同源臂,以及可将crRNA阵列整合到枯草芽孢杆菌基因组的amyE位点。
8.权利要求1~7任一项所述的基于CRISPR/Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统在枯草芽孢杆菌多基因编辑和表达调控中的应用。
CN201911387447.8A 2019-12-27 2019-12-27 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统 Active CN110951741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911387447.8A CN110951741B (zh) 2019-12-27 2019-12-27 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911387447.8A CN110951741B (zh) 2019-12-27 2019-12-27 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统

Publications (2)

Publication Number Publication Date
CN110951741A CN110951741A (zh) 2020-04-03
CN110951741B true CN110951741B (zh) 2021-11-02

Family

ID=69984762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911387447.8A Active CN110951741B (zh) 2019-12-27 2019-12-27 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统

Country Status (1)

Country Link
CN (1) CN110951741B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108998406B (zh) * 2018-08-03 2022-05-10 福州大学 一种人类原代培养细胞基因组编辑、定点基因敲入方法
CN111518778A (zh) * 2020-04-30 2020-08-11 北京紫陌科技有限公司 一种重组RecA酶、RAA反应体系、试剂盒及其应用
CN112481278B (zh) * 2020-12-09 2023-02-21 江南大学 一种基于aip诱导的生物传感器及其应用
CN112592926A (zh) * 2020-12-28 2021-04-02 江南大学 一种crispr系统及其在高山被孢霉中的应用
CN112760338B (zh) * 2020-12-28 2022-04-26 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于深海真菌FS140的CRISPR/Cpf1载体及其构建方法和应用
CN113373170A (zh) * 2021-04-29 2021-09-10 江西农业大学 一种pFnCpfAb/pCrAb双质粒系统及其应用
CN113999868A (zh) * 2021-12-06 2022-02-01 齐鲁制药(内蒙古)有限公司 一种高产多杀菌素j/l的工程菌及其构建方法与应用
CN116262927B (zh) * 2021-12-13 2024-04-26 中国科学院微生物研究所 基于CRISPR/Cas系统调控基因表达的方法及其应用
CN114836459B (zh) * 2022-03-17 2024-01-26 江南大学 一种胞嘧啶碱基编辑系统及其应用
CN114875056B (zh) * 2022-05-27 2023-10-10 华东理工大学 一种基于CRISPR-Cas9系统进行枯草芽孢杆菌基因组编辑的方法及其应用
CN116286574B (zh) * 2023-02-09 2023-12-12 中国农业大学 精准调控Bacillus subtilis内源多基因表达的CRISPRa方法及其应用
CN116751799B (zh) * 2023-06-14 2024-01-26 江南大学 一种多位点双重碱基编辑器及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105671070A (zh) * 2016-03-03 2016-06-15 江南大学 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法
CN109136248A (zh) * 2017-08-31 2019-01-04 苏州金唯智生物科技有限公司 多靶点编辑载体及其构建方法和应用
CN110358767A (zh) * 2019-07-30 2019-10-22 湖北大学 一种基于CRISPR-Cas12a系统的运动发酵单胞菌基因组编辑方法及其应用
CN110577963A (zh) * 2019-09-19 2019-12-17 天津大学 提高枯草芽孢杆菌CRISPR-Cas9n系统基因组多位点编辑效率的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105671070A (zh) * 2016-03-03 2016-06-15 江南大学 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法
CN109136248A (zh) * 2017-08-31 2019-01-04 苏州金唯智生物科技有限公司 多靶点编辑载体及其构建方法和应用
CN110358767A (zh) * 2019-07-30 2019-10-22 湖北大学 一种基于CRISPR-Cas12a系统的运动发酵单胞菌基因组编辑方法及其应用
CN110577963A (zh) * 2019-09-19 2019-12-17 天津大学 提高枯草芽孢杆菌CRISPR-Cas9n系统基因组多位点编辑效率的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CAMERS-B: CRISPR/Cpf1 assisted multiple-genes editing and regulation system for Bacillus subtilis;Wu, Yaokang等;《BIOTECHNOLOGY AND BIOENGINEERING》;20200304;第117卷(第6期);第1817-1825页 *
Development and characterization of a CRISPR/Cas9n-based multiplex genome editing system for Bacillus subtilis;Liu, Dingyu等;《BIOTECHNOLOGY FOR BIOFUELS》;20190927;第12卷(第1期);第1-17 *

Also Published As

Publication number Publication date
CN110951741A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110951741B (zh) 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统
KR102191739B1 (ko) 변형된 구제역 바이러스 3c 프로테아제, 조성물 및 이의 방법
US20030159160A1 (en) Method for the stable inversion of DNA sequence by site-specific recombination and DNA vectors and transgenic cells thereof
CN112813037B (zh) 一种高效感染原代小胶质细胞的重组突变腺相关病毒及其相关生物材料
CA2763792C (en) Expression cassettes derived from maize
CN109943581B (zh) 一种质粒以及噬菌体辅助的连续定向进化系统和定向进化方法
CN110878322B (zh) 一种用于肺炎克雷伯菌基因编辑的双质粒系统
CN107574175A (zh) 一种基于重组腺病毒的表达载体及其构建方法
KR102320656B1 (ko) 아세틴 화합물의 생물학적 제조 방법
CN107988250B (zh) 一种通用型衣藻外源基因表达载体构建方法
CN110241098B (zh) 酿脓链球菌的CRISPR核酸酶SpCas9的截短型高特异性变异体及其应用
CN110951770B (zh) 一种简单快速高效的CRISPR/Cas9载体构建方法及应用
CN108456687A (zh) 基于赖氨酸浓度控制的重组表达质粒、转化子及其应用
CN110964725A (zh) 特异性识别猪KIT基因的sgRNA及其编码DNA、试剂盒和应用
CN111909914B (zh) 核酸内切酶SpCas9的高PAM兼容性截短型变异体txCas9及其应用
CN110656120A (zh) 一种乙脑病毒sa14-14-2的克隆方法及应用
CN111909959B (zh) 一种条件性Yap1基因敲入小鼠的构建方法和应用
CN110272881B (zh) 核酸内切酶SpCas9高特异性截短变异体TSpCas9-V1/V2及其应用
CN110241099B (zh) 酿脓链球菌的CRISPR核酸酶SpCas9 的截短变异体及其应用
CN112553237A (zh) 一种新型mariner转座子系统、应用和构建枯草芽孢杆菌插入突变株文库
CN109136228A (zh) 长链非编码rna-nkila在骨组织损伤修复中的应用
CN113881670B (zh) 抗大豆花叶病毒的转基因植物构建方法
CN110016481A (zh) 一种pX335-xCas9n载体及其构建方法和应用
KR102508883B1 (ko) 면역원성 조성물의 제조방법
CN112662697B (zh) 一种莱茵衣藻tctn1表达质粒及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant