CN114457100B - 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用 - Google Patents

一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用 Download PDF

Info

Publication number
CN114457100B
CN114457100B CN202210209559.XA CN202210209559A CN114457100B CN 114457100 B CN114457100 B CN 114457100B CN 202210209559 A CN202210209559 A CN 202210209559A CN 114457100 B CN114457100 B CN 114457100B
Authority
CN
China
Prior art keywords
plasmid
gene
pcreg
peccpf1
gene editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210209559.XA
Other languages
English (en)
Other versions
CN114457100A (zh
Inventor
刘龙
陈坚
吕雪芹
堵国成
李江华
刘延峰
朱学文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202210209559.XA priority Critical patent/CN114457100B/zh
Publication of CN114457100A publication Critical patent/CN114457100A/zh
Application granted granted Critical
Publication of CN114457100B publication Critical patent/CN114457100B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用。本发明的大肠杆菌基因编辑系统包括:质粒pEcCpf1和质粒pcrEG;或质粒pEcCpf1H和质粒pcrEG;质粒pEcCpf1通过将pEcCas载体上的Cas9蛋白替换为Cpf1蛋白,靶向基因pMB1的sgRNA替换为靶向基因pMB1的crRNA序列得到,其中,所述质粒pEcCpf1上连接有编码λ‑Red重组酶系的基因,质粒pcrEG通过将pTarget载体上的sgRNA插入区替换为crRNA插入区,并插入sfgfp基因得到;质粒pEcCpf1H通过将质粒pEcCpf1中的λ‑Red重组酶系替换成CspRecT蛋白得到。本发明应用该基因编辑系统进行基因整合、基因敲除以及基因修饰的简便方法,解决了传统基因编辑系统进行多位点编辑时需要多个启动子且大片段插入困难的问题。

Description

一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用
技术领域
本发明涉及生物技术领域,尤其涉及一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用。
背景技术
大肠杆菌作为一种重要的模式工业微生物,不仅被用于微生物机理研究,也被广泛用于生物燃料,重要的化学品,药品等的生产。为了防止噬菌体的入侵,微生物进化出了很多防御系统,而CRISPR-Cas(clustered regularly interspaced short palindromicrepeats and CRISPR-associated proteins)系统则是其中比较常见的一种获得性免疫系统。以目前研究最为广泛的酿脓链球菌(Streptococcus pyogenes)的CRISPR/Cas9系统为例,其作用机制如下:当第一次受到新的噬菌体入侵时,其会将噬菌体基因组上的原间隔序列(postospacer)作为新的间隔序列插入到基因组上CRISPR序列的起始序列之后,作为第一个间隔序列;当再次受到该噬菌体入侵式,该CRISPR序列会转录产生一条长链RNA,即前体crRNA(pre-crRNA),随后在Cas蛋白复合体和tracrRNA(trans-activating crRNA)的共同作用下,pre-crRNA被剪切产生成熟的crRNAs;tracrRNA与crRNA形成的复合体可以结合Cas9蛋白并引导其识别特定的噬菌体DNA并将其切割产生双链断裂(DSB),从而将其破坏。
利用上述的作用机制,经过人为改造,可以使Cas9蛋白识别并切割细菌的基因组产生DSB;然后通过导入同源模板便可以在同源重组修复的过程中将特定的修饰引入到细菌的基因组上;由于没有成功修复的菌株会因为DSB而致死,因此只有成功修复并引入突变才会使得Cas9蛋白不再识别并切割细胞的基因组,细胞才能存活下来,这就是利用CRISPR/Cas9进行基因编辑的基本原理。同时为了操作的方便性,常常将crRNA和tracrRNA构建成一个嵌合体即sgRNA(small guide RNA)进行表达,这样只需要表达sgRNA和Cas9蛋白便可进行基因编辑。目前除了CRISPR/Cas9系统以外,CRISPR/Cpf1系统也常被应用于基因编辑,与CRISPR/Cas9系统不同的是,CRISPR/Cpf1只需要crRNA便可发挥作用;而且Cpf1自身就具有RNA酶的活力,可以对pre-crRNA进行加工;因此可以设计一段由多个crRNA组成的crRNA阵列,当其被Cpf1处理成为多个成熟的crRNA之后便可以同时引导Cpf1在基因组多个位置进行切割,实现多个位点的同时编辑。
目前大肠杆菌中已经有多项CRISPR/Cas9的基因编辑系统以及应用研究,但是CRISPR/Cpf1系统的研究并不多。而且当利用基于CRISPR/Cas9的基因编辑系统对大肠杆菌进行多位点编辑时,需要表达多个sgRNA,并且每个sgRNA都需要各自的启动子,所以也增加了构建质粒的难度,而且使用CRISPR/Cas9在大肠杆菌基因组上进行大片段的插入时也比较困难。因此,仍需要寻找一种新的大肠杆菌基因编辑方法。
发明内容
为解决上述技术问题,本发明提供了两种基于CRISPR/Cpf1的大肠杆菌基因编辑系统,其中一种为pEcCpf1/pcrEG基因编辑系统,运用该系统可以在大肠杆菌中实现基因整合以及基因敲除,该系统能以较高的效率在大肠杆菌基因组中插入不同长度的DNA片段(1000bp-9000bp),解决了传统基因编辑系统大片段插入困难的问题;第二种为pEcCpf1H/pcrEG基因编辑系统,该系统可以使用90-nt的单链引物当作同源臂在大肠杆菌的基因组上方便快捷的实现单基因或多个基因的完整敲除以及修饰。
本发明的第一个目的是提供一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统,该大肠杆菌基因编辑系统包括:
质粒pEcCpf1和质粒pcrEG;
或质粒pEcCpf1H和质粒pcrEG;
质粒pEcCpf1通过将pEcCas载体上的Cas9蛋白替换为Cpf1蛋白,靶向基因pMB1的sgRNA替换为靶向基因pMB1的crRNA序列得到,其中,所述质粒pEcCpf1上连接有编码λ-Red重组酶系的基因,所述λ-Red重组酶系包括Gam蛋白、Bet蛋白和Exo蛋白;
质粒pcrEG通过将pTarget载体上的sgRNA插入区替换为crRNA插入区,并且插入sfgfp基因得到;
质粒pEcCpf1H通过将上述质粒pEcCpf1中的λ-Red重组酶系替换成CspRecT蛋白得到。
进一步地,质粒pEcCpf1的核苷酸序列如SEQ ID NO.1所示。
进一步地,质粒pEcCpf1H的核苷酸序列如SEQ ID NO.2所示。
进一步地,质粒pcrEG的核苷酸序列如SEQ ID NO.3所示。
本发明中,质粒pcrEG上的sfgfp基因可方便正确插入crRNA序列菌株的筛选,crRNA插入后,可以将其替换为所需编辑的同源臂,作为同源臂插入区;crRNA阵列中,多个crRNA可通过阵列的形式进行表达且crRNA阵列插入区上游含有Pj23119启动子,用于所需crRNA阵列的表达。
进一步地,质粒pEcCpf1或质粒pEcCpf1H含有pSC101复制子且具有第一抗生素抗性。如本发明的一个实施例中,第一抗生素为卡那霉素。
进一步地,质粒pcrEG含有pMB1复制子且具有第二抗生素抗性。如本发明的一个实施例中,第二抗生素为壮观霉素。
进一步地,编码Cpf1蛋白的fncpf1基因的核苷酸序列如SEQ ID NO.4所示。
进一步地,质粒pEcCpf1含有的λ-Red重组酶系中,编码Gam蛋白的基因的核苷酸序列如SEQ ID NO.5所示,编码Bet蛋白的基因的核苷酸序列如SEQ ID NO.6所示,编码Exo蛋白的基因的核苷酸序列如SEQ ID NO.7所示。该λ-Red重组酶系来源于大肠杆菌的λ噬菌体,用于促进大肠杆菌中的同源重组。
进一步地,质粒pEcCpf1H中,编码CspRecT蛋白的csprecT基因的核苷酸序列如SEQID NO.8所示。
进一步地,质粒pEcCpf1或质粒pEcCpf1H中,λ-Red重组酶系或CspRecT蛋白通过诱导型启动子ParaB调控表达。
进一步地,crRNA阵列插入区的两端含有Eco31I酶切位点,可以用于crRNA序列的快速组装。
本发明的第二个目的是提供上述基于CRISPR/Cpf1的大肠杆菌基因编辑系统在大肠杆菌单基因编辑或多基因编辑中的应用。
进一步地,应用上述基于CRISPR/Cpf1的大肠杆菌基因编辑系统pEcCpf1/pcrEG系统于大肠杆菌的基因敲除和基因整合。其中,该系统在进行基因编辑时,共转化同源臂和crRNA表达质粒只能进行基因敲除,不能实现基因整合,所以在后续的基因编辑中,我们都将同源臂连接在crRNA表达载体上。
进一步地,在使用pEcCpf1/pcrEG系统进行基因编辑时,电转法或化转法都可将质粒导入大肠杆菌中。优选为化转法,相比于电转,大肠杆菌的化转更稳定,能够获得更多的转化子从而具有更高的基因编辑效率。
进一步地,同源臂连接在质粒pcrEG上。由表1和表2的对比中可看出(其中,表1为pEcCpf1/pcrEG系统介导的基因编辑效率(共转化质粒和同源臂)表2pEcCpf1/pcrEG系统介导的基因编辑效率(同源臂连接在crRNA表达质粒上)),将同源臂连接在质粒pcrEG上而非共转化质粒和同源臂,其基因编辑效率大大提高。
进一步地,应用上述基于CRISPR/Cpf1的大肠杆菌基因编辑系统pEcCpf1H/pcrEG系统于大肠杆菌中的基因敲除,碱基编辑以及多基因编辑。
进一步地,在使用pEcCpf1H/pcrEG系统进行基因编辑时,采用电转法将质粒导入大肠杆菌中。
进一步地,利用引物作为同源模板进行基因编辑时,由于DNA复制过程中有先导链和后随链之分,优选将作为同源臂的单链引物设置在后随链上,基因编辑效率会更高(区分大肠杆菌基因组上先导链和后随链如图4所示)。
进一步地,上述基因编辑中,crRNA阵列插入方法引用方法“SOMACA”,来源于文献CAMERS-B:CRISPR/Cpf1 assisted multiple-genes editing and regulation systemfor Bacillus subtilis。具体地,当表达单个crRNA时,此时crRNA可以直接通过设计带有重叠区的一对引物,经过变性退火形成带有粘性末端的引物二聚体(订购的引物浓度为10μM/μL,反应体系为20μL,即上下游引物各10μL。反应条件为:98℃2min,0.1℃/s降温至4℃后保温。)反应过后将其稀释10倍,取1μL与酶切后的载体连接即可。连接方式:10μL体系,其中酶切后的载体1μL,引物二聚体稀释液1μL,T4连接酶1μL,T4连接酶buffer1μL。配好的体系与22℃中反应3h,或16℃过夜。当设计多个crRNA阵列时,我们需要用DR2将不同的靶序列隔开构建一个crRNA阵列即可,这样当crRNA阵列作为一个转录单元变成前体crRNA后,Cpf1会在DR2前进行切割,从而形成成熟的crRNA。此时crRNA片段的构建过程和单片段不同,因为crRNA之间的连接液需要磷酸基团,若此时仍合成引物进行退火,后续则还需要进行磷酸化,不然无法连接。多个crRNA通过具有重叠区的引物进行PCR,从而形成平末端的二聚体(PrimerSTAR延伸5s,20个循环,结束后同样稀释10倍),并通过引物在其5′端引入Eco31I这个酶切位点,便可以在酶切后形成任意的粘性末端。之后取多个crRNA的引物二聚体稀释液各1μL进行Golden gate组装即可。
进一步地,在导入质粒pEcCpf1或pEcCpf1H后,制备大肠杆菌感受态细胞时,向体系中加入终浓度为10mM的阿拉伯糖以诱导质粒pEcCpf1上λ-Red重组酶系或pEcCpf1H上CspRecT蛋白的表达。
进一步地,当基因编辑操作结束后,通过第一抗生素和第二抗生素筛选出同时转入质粒pEcCpf1和质粒pcrEG的阳性大肠杆菌。可再通过菌落PCR和Sanger测序验证基因编辑情况。
本发明的基因编辑系统中,质粒pEcCpf1和质粒pEcCpf1H中靶向基因pMB1的crRNA序列在受鼠李糖调控的诱导型启动子PrhaB的调控下表达,从而可以切割消除质粒pcrEG。而且,质粒pEcCpf1和质粒pEcCpf1H中含有sacB基因,当培养基中存在蔗糖时会对细胞产生毒性,从而可以将质粒pEcCpf1或质粒pEcCpf1H消除。
借由上述方案,本发明至少具有以下优点:
本发明构建了Cpf1表达载体pEcCpf1和crRNA表达载体pcrEG,在大肠杆菌中可以完成1000-9000bp范围内DNA片段的高效整合(整合片段时同源臂和整合基因需放到crRNA表达载体上);此外,本发明构建的Cpf1表达载体pEcCpf1H和crRNA表达载体pcrEG在大肠杆菌中可通过使用引物作为同源臂完成两个基因的完整敲除、两个基因的碱基修饰以及短序列(25bp左右均可)的插入。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合详细附图说明如后。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明。
图1为本发明90-nt单链引物设计原则示意图;
图2为本发明大肠杆菌不同转化方式的转化效率;
图3为pEcCpf1/pcrEG系统介导的不同长度的DNA片段的敲除与整合效率;
图4为大肠杆菌中先导链和后随链的区分方式;
图5为本发明利用质粒pEcCpf1进行基因编辑时的基因编辑系统;
图6为本发明利用质粒pEcCpf1H进行基因编辑时的基因编辑系统;
图7为质粒pEcCpf1和质粒pEcCpf1H利用单链引物进行基因编辑时的效率对比图。
图8为pEcCpf1/pcrEG系统介导的不同转化方式的基因整合效率;
图9为pEcCpf1H/pcrEG系统介导的不同长度DNA片段的敲除效率;
图10为pEcCpf1H/pcrEG系统介导的单点突变以及短序列插入的编辑效率;
图11为pEcCpf1H/pcrEG系统介导的多基因编辑效率;
图12为pEcCpf1/pcrEG系统和pEcCpf1H/pcrEG系统进行基因编辑的示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明下述实施例中涉及以下具体操作方法:
所述的大肠杆菌基因编辑系统pEcCpf1/pcrEG进行基因编辑时,包括如下步骤(后面所述的抗生素浓度为:卡那霉素:50μg/mL,壮观霉素:100μg/mL):
(1)首先将Cpf1表达载体pEcCpf1转化到大肠杆菌中,涂布在含有卡那霉素的LB培养基平板上得到阳性菌落。
(2)设计靶向特异性的crRNA阵列,连接到载体pcrEG上。
(3)先将同源臂连接到含有crRNA序列的载体pcrEG中,然后再将其转化到(1)中所述的大肠杆菌中,这样不仅会更快的得到菌落,并且在基因插入时,编辑效率也会大幅度提升(此种方法使用化转即可)。另外,在制备含有质粒pEcCpf1的大肠杆菌感受态时,需要加入终浓度为10mM的阿拉伯糖诱导质粒上同源重组酶的表达。(注:共转化crRNA表达质粒和同源模板时只能实现基因敲除,不能实现基因整合,结果见表1;所以后续在使用该系统时,将编辑所需的同源臂连接在crRNA表达载体上)。
表1
Figure BDA0003530464350000081
(4)转化第二个载体后,加入1mL的LB培养基后培养1.5-2h,然后5000g离心3分钟后弃去900μL培养基,留下100μL培养基将菌体重悬并涂布到含有卡那霉素和壮观霉素的LB平板上。
(5)长出单菌落后通过菌落PCR和Sanger测序验证基因编辑情况,阳性菌株可以只将第二个质粒(即crRNA表达质粒)消除,而将pEcCpf1质粒留在菌中,以方便后续的基因编辑操作。
(6)质粒消除的方法如下:首先将验证正确的阳性菌株接种到含有卡那霉素和终浓度为10mM的鼠李糖的LB培养基中(2mL培养基即可),过夜培养后(12h左右即可)划线在含有卡那霉素的LB平板上,待平板上长出单菌落后,挑选菌落分别点在含有卡那霉素和含有壮观霉素的LB平板上,当单菌落在含有卡那霉素的平板上生长但是在含有壮观霉素的平板上不长时,可以确认crRNA表达质粒已被成功消除;然后将该单菌落接种在含有5g/L的葡萄糖的无抗LB培养基中过夜培养(12h左右即可),然后将菌液划线在含有5g/L的葡萄糖和10g/L的蔗糖的LB平板上,待平板上长出单菌落后,挑选单菌落分别点在含有卡那霉素的平板和无抗的LB平板上,当单菌落在含有卡那霉素的平板上不生长但是在无抗的LB平板上生长时,可以确认消除pEcCpf1质粒。
所述的大肠杆菌多基因编辑系统pEcCpf1H/pcrEG基因编辑系统用于大肠杆菌基因编辑时,步骤如下:
(1)首先将Cpf1表达载体pEcCpf1H转化到大肠杆菌中,涂布在卡那霉素的LB培养基平板上得到阳性菌落;
(2)设计靶向特异性的crRNA阵列,连接到载体pcrEG上;若要进行多基因编辑,则设计多个靶向特异性的crRNA形成crRNA阵列连接到载体pcrEG上。
(3)设计90-nt的单链引物作为同源模板(设计原则如图1所示),并将其与crRNA表达质粒同时转化到上述(1)中的含有pEcCpf1H的大肠杆菌中(此步骤使用电转,因为化转单链的引物和crRNA表达质粒不能实现基因编辑);在制备含有质粒pEcCpf1H的大肠杆菌感受态时,需要加入终浓度为10mM的阿拉伯糖诱导质粒上同源重组酶的表达。
(4)转化第二个载体后,加入1mL的LB培养基后培养2h,然后5000g离心3分钟后弃去900μL培养基,留下100μL培养基将菌体冲悬并涂布在含有卡那霉素和壮观霉素的LB平板上。
(5)长出单菌落后用菌落PCR以及Sanger测序验证基因编辑情况,阳性菌株可续的基因编辑操作。
(6)质粒消除方法与上述步骤(6)相同。
实施例1构建Cpf1表达载体pEcCpf1
首先使用序列如下表中序列1和序列2所示的引物以质粒pEcCas为模板通过PCR扩增出片段1,然后使用序列如下表中3和4所示的引物以质粒pHT-XCR6为模板通过PCR扩增出片段2(载体pHT-XCR6可通过Molecular Cloud质粒共享平台获取,编号为MC_0068418),接着使用序列如下表中5和6所示的引物以质粒pEcCas为模板通过PCR克隆出片段3。最后通过无缝克隆试剂盒将这三个片段构成质粒pEcCpf1(序列如SEQ ID NO.1所示)。
编号 引物序列
1 5′-agagcgcagatacatctacaacagtagaaattatttaaagttcttagactacgaccagtctaaaaagcgc-3′
2 5′-aaattgacatttttgcctcctaaaataaaaagtttaaattaaatcc-3′
3 5′-ggaggcaaaaatgtcaatttatcaagaatttgttaataaatatagtttaag-3′
4 5′-ctttagttattcctattctgcacgaact-3′
5 5′-cgtgcagaataggaataactaaagtatattttagatgaagattatttcttaatctagacat-3′
6 5′-tgtagatgtatctgcgctctgctgaagccaaatttctactgttgtagatactatcgtcttgagtccaacc-3′
实施例2构建Cpf1表达载体pEcCpf1H
使用序列如下表中序列1和2所示的引物以质粒pEcCpf1为模板通过PCR扩增出片段1,然后使用序列如3和4所示的引物以质粒CspRecT为模板通过PCR扩增出片段2。最后通过无缝克隆试剂盒将这两个片段构成质粒pEcCpf1H(序列如SEQ ID NO.2所示)。
编号 引物序列
1 5′-ggtgttttaaatgacaccggacattatcctgca-3′
2 5′-ttcacgatttggttcattcgttttatacctctgaatcaatatcaacctgg-3′
3 5′-cgaatgaaccaaatcgtgaagttcactgac-3′
4 5′-ccggtgtcatttaaaacacctcgccttcgtcaac-3′
实施例3构建crRNA阵列表达载体pcrEG
首先使用序列如下表序列1和2所示的引物以质粒pTarget为模板通过PCR扩增出片段1,然后使用序列如3和4所示的引物以质粒pcrF19NM2为模板通过PCR扩增出片段2(质粒pcrF19NM2可通过Molecular Cloud质粒共享平台获取,编号为MC_0101256)。接着使用序列如5和6所示的引物以质粒pHT-Pgrac100-sfGFP为模板通过PCR扩增出片段3。最后通过无缝克隆试剂盒将三个片段构成质粒pcrEG(序列如SEQ ID NO.3所示)。
编号 引物序列
1 5′-ctacaaataacgaacggcagatcagaatt-3′
2 5′-cctcgcgtctctacctctactagtattatacctaggactgagct-3′
3 5′-gtagaggtagagacgcgagg-3′
4 5′-acgttaataaggccaagctaactaagtttgaaa-3′
5 5′-tagcttggccttattaacgttgatataatttaaattttatttgacaaaaatg-3′
6 5′-ctgccgttcgttatttgtagagctcatccatgcca-3′
实施例4 pEcCpf1/pcrEG系统在大肠杆菌中介导的基因编辑
首先将质粒pEcCpf1转化到需要编辑的大肠杆菌宿主中。
利用质粒pEcCpf1进行基因编辑时,根据待编辑的基因设计其相应的crRNA阵列以及同源臂并将其分别连入质粒pcrEG中(见图5)。
实施例5大肠杆菌不同转化方式对转化效率的影响
利用质粒pEcCpf1进行基因编辑时,制备了化转感受态和电转感受态两种,并分别添加了终浓度为0mM和10mM的阿拉伯糖,然后在每种感受态中转化了相同浓度的壮观霉素抗性的质粒(无crRNA序列的pcrEG质粒),通过统计转化子数量来比较转化效率(见图2)。
从图2中可以看出,相比于电转感受态,化转感受态具有更高的转化效率,且能够获得更多的转化子。若在制备感受态时添加10mM的阿拉伯糖,则会降低感受态的转化效率。
实施例6 pEcCpf1/pcrEG系统介导的不同转化方式的基因编辑效率利用质粒pEcCpf1进行基因编辑时,对于整合基因,同时采取了化转和电转两种方式,比较两种转化方式的基因编辑效率。并且在添加了阿拉伯糖的感受态中,还同时共转化了左右各50bp同源臂和目的基因的片段(见图8)。
尝试了6种不同的转化方式(电转和化转各3种),最终发现,在制备含有pEcCpf1质粒的大肠杆菌化转感受态时添加终浓度为10mM的阿拉伯糖,然后利用化转的方式将crRNA表达质粒转入上述化转感受态中,基因编辑效率接近100%,并且能够获得较多的转化子。所以在后续的基因编辑中,pEcCpf1/pcrEG系统通过将同源臂连接在crRNA表达质粒上,采用化转的方式实施基因编辑。
实施例7 pEcCpf1/pcrEG系统介导的在大肠杆菌中不同PAM区的基因编辑效率以及不同转化方式的转化效率
选择基因xylR和基因ykgh作为目标基因,验证该系统的敲除效率。选择基因ykgh作为插入位点,插入prs基因;同时选取xylR基因作为插入位点,在其中插入gfp基因(结果见表2)。
表2
Figure BDA0003530464350000131
实施例8 pEcCpf1/pcrEG系统介导的在大肠杆菌中不同长度的DNA片段的敲除与整合效率
选择基因mutS作为插入位点,在其上插入了1000-9000bp长度的DNA片段(结果见图3A);在基因xylR上设计一个crRNA,通过设计不同的同源臂在大肠杆菌中敲除不同长度的片段(结果见图3B)。
如图3所示,将同源臂放在crRNA表达质粒上,采用化转的方式将质粒转入含有pEcCpf1质粒的大肠杆菌宿主中,可成功插入长达9000bp的DNA片段;并且该系统还可以在大肠杆菌中以很高的效率完成不同长度片段的敲除。
实施例9 pEcCpf1H/pcrEG系统在大肠杆菌中介导的基因编辑
首先将质粒pEcCpf1H转化到需要编辑的大肠杆菌宿主中。
利用质粒pEcCpf1H进行基因编辑时,设计90-nt的单链引物作为同源臂,并将所需的crRNA阵列连入质粒pcrEG中(见图6)。
实施例10质粒pEcCpf1和质粒pEcCpf1H利用单链引物进行单基因敲除的效率对比
选取基因xylR和基因ykgh,利用引物做同源臂,质粒pEcCpf1和质粒pEcCpf1H分别做单基因的敲除(见图7)。
从图7中可看出,当利用单链引物作为同源臂进行基因敲除时,表达质粒pEcCpf1H具有更高的编辑效率并且能够获得更多的转化子。
实施例11 pEcCpf1H/pcrEG系统介导的大肠杆菌中不同长度DNA片段的敲除效率
在大肠杆菌基因组上的yjiR基因上设计一个crRNA,通过设计不同的90-nt的单链引物,实现不同长度的DNA片段的敲除,结果如图9所示。
从图9中可以看出,该系统可以以超过40%的效率,利用引物作为同源臂,在大肠杆菌上敲除10kb长度的DNA片段。
实施例12 pEcCpf1H/pcrEG系统介导的大肠杆菌中的单碱基突变,短序列插入的效率
选取大肠杆菌上的xylR,ykgh,mlc,hisG基因为突变位点,利用该系统对上述基因上的一个碱基进行突变;选取大肠杆菌基因组上的flDh基因的启动子区为位点,利用该系统在此区域插入一段25bp的序列。结果如图10所示。
该系统可以以接近100%的效率在大肠杆菌基因组上实现单碱基突变,可以以70%左右的编辑效率在大肠杆菌基因组上插入一段25bp的序列。
实施例13 pEcCpf1H/pcrEG系统介导的大肠杆菌中的多基因编辑
选取大肠杆菌基因组上的xylR,ykgh基因以及hisG,mlc基因为靶点,利用该系统同时对xylR,ykgh基因进行敲除以及碱基修饰,同时利用该系统对hisG,mlc基因进行敲除以及碱基修饰。
结果如图11所示,该系统可以以60%的效率同时对大肠杆菌基因组上两个基因进行碱基修饰,但是同时敲除两个基因的效率比较低,只有10%左右。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
序列表
<110> 江南大学
<120> 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 14479
<212> DNA
<213> (人工序列)
<400> 1
catgggtatg gacagttttc cctttgatat gtaacggtga acagttgttc tacttttgtt 60
tgttagtctt gatgcttcac tgatagatac aagagccata agaacctcag atccttccgt 120
atttagccag tatgttctct agtgtggttc gttgtttttg cgtgagccat gagaacgaac 180
cattgagatc atgcttactt tgcatgtcac tcaaaaattt tgcctcaaaa ctggtgagct 240
gaatttttgc agttaaagca tcgtgtagtg tttttcttag tccgttacgt aggtaggaat 300
ctgatgtaat ggttgttggt attttgtcac cattcatttt tatctggttg ttctcaagtt 360
cggttacgag atccatttgt ctatctagtt caacttggaa aatcaacgta tcagtcgggc 420
ggcctcgctt atcaaccacc aatttcatat tgctgtaagt gtttaaatct ttacttattg 480
gtttcaaaac ccattggtta agccttttaa actcatggta gttattttca agcattaaca 540
tgaacttaaa ttcatcaagg ctaatctcta tatttgcctt gtgagttttc ttttgtgtta 600
gttcttttaa taaccactca taaatcctca tagagtattt gttttcaaaa gacttaacat 660
gttccagatt atattttatg aattttttta actggaaaag ataaggcaat atctcttcac 720
taaaaactaa ttctaatttt tcgcttgaga acttggcata gtttgtccac tggaaaatct 780
caaagccttt aaccaaagga ttcctgattt ccacagttct cgtcatcagc tctctggttg 840
ctttagctaa tacaccataa gcattttccc tactgatgtt catcatctga gcgtattggt 900
tataagtgaa cgataccgtc cgttctttcc ttgtagggtt ttcaatcgtg gggttgagta 960
gtgccacaca gcataaaatt agcttggttt catgctccgt taagtcatag cgactaatcg 1020
ctagttcatt tgctttgaaa acaactaatt cagacataca tctcaattgg tctaggtgat 1080
tttaatcact ataccaattg agatgggcta gtcaatgata attactagtc cttttccttt 1140
gagttgtggg tatctgtaaa ttctgctaga cctttgctgg aaaacttgta aattctgcta 1200
gaccctctgt aaattccgct agacctttgt gtgttttttt tgtttatatt caagtggtta 1260
taatttatag aataaagaaa gaataaaaaa agataaaaag aatagatccc agccctgtgt 1320
ataactcact actttagtca gttccgcagt attacaaaag gatgtcgcaa acgctgtttg 1380
ctcctctaca aaacagacct taaaacccta aaggcttaag tagcaccctc gcaagctcgg 1440
ttgcggccgc aatcgggcaa atcgctgaat attccttttg tctccgacca tcaggcacct 1500
gagtcgctgt ctttttcgtg acattcagtt cgctgcgctc acggctctgg cagtgaatgg 1560
gggtaaatgg cactacaggc gccttttatg gattcatgca aggaaactac ccataataca 1620
agaaaagccc gtcacgggct tctcagggcg ttttatggcg ggtctgctat gtggtgctat 1680
ctgacttttt gctgttcagc agttcctgcc ctctgatttt ccagtctgac cacttcggat 1740
tatcccgtga caggtcattc agactggcta atgcacccag taaggcagcg gtatcatcaa 1800
cccactgcag caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 1860
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 1920
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 1980
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 2040
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 2100
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 2160
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 2220
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 2280
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 2340
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 2400
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 2460
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 2520
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 2580
aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat 2640
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgatg 2700
atatattttt atcttgtgca atgtaacatc agagattttg agacacaacg tggctttccc 2760
tgcagctgaa caatacttaa tactatagaa tgataacaaa ataaactact ttttaaaaga 2820
attttgtgtt ataatctatt tattattaag tattgggtaa tattttttga agagatattt 2880
tgaaaaagaa aaattaaagc atattaaact aatttcggag gtcattaaaa ctattattga 2940
aatcatcaaa ctcattatgg atttaattta aactttttat tttaggaggc aaaaatgtca 3000
atttatcaag aatttgttaa taaatatagt ttaagtaaaa ctctaagatt tgagttaatc 3060
ccacagggta aaacacttga aaacataaaa gcaagaggtt tgattttaga tgatgagaaa 3120
agagctaaag actacaaaaa ggctaaacaa ataattgata aatatcatca gttttttata 3180
gaggagatat taagttcggt ttgtattagc gaagatttat tacaaaacta ttctgatgtt 3240
tattttaaac ttaaaaagag tgatgatgat aatctacaaa aagattttaa aagtgcaaaa 3300
gatacgataa agaaacaaat atctgaatat ataaaggact cagagaaatt taagaatttg 3360
tttaatcaaa accttatcga tgctaaaaaa gggcaagagt cagatttaat tctatggcta 3420
aagcaatcta aggataatgg tatagaacta tttaaagcca atagtgatat cacagatata 3480
gatgaggcgt tagaaataat caaatctttt aaaggttgga caacttattt taagggtttt 3540
catgaaaata gaaaaaatgt ttatagtagc aatgatattc ctacatctat tatttatagg 3600
atagtagatg ataatttgcc taaatttcta gaaaataaag ctaagtatga gagtttaaaa 3660
gacaaagctc cagaagctat aaactatgaa caaattaaaa aagatttggc agaagagcta 3720
acctttgata ttgactacaa aacatctgaa gttaatcaaa gagttttttc acttgatgaa 3780
gtttttgaga tagcaaactt taataattat ctaaatcaaa gtggtattac taaatttaat 3840
actattattg gtggtaaatt tgtaaatggt gaaaatacaa agagaaaagg tataaatgaa 3900
tatataaatc tatactcaca gcaaataaat gataaaacac tcaaaaaata taaaatgagt 3960
gttttattta agcaaatttt aagtgataca gaatctaaat cttttgtaat tgataagtta 4020
gaagatgata gtgatgtagt tacaacgatg caaagttttt atgagcaaat agcagctttt 4080
aaaacagtag aagaaaaatc tattaaagaa acactatctt tattatttga tgatttaaaa 4140
gctcaaaaac ttgatttgag taaaatttat tttaaaaatg ataaatctct tactgatcta 4200
tcacaacaag tttttgatga ttatagtgtt attggtacag cggtactaga atatataact 4260
caacaaatag cacctaaaaa tcttgataac cctagtaaga aagagcaaga attaatagcc 4320
aaaaaaactg aaaaagcaaa atacttatct ctagaaacta taaagcttgc cttagaagaa 4380
tttaataagc atagagatat agataaacag tgtaggtttg aagaaatact tgcaaacttt 4440
gcggctattc cgatgatatt tgatgaaata gctcaaaaca aagacaattt ggcacagata 4500
tctatcaaat atcaaaatca aggtaaaaaa gacctacttc aagctagtgc ggaagatgat 4560
gttaaagcta tcaaggatct tttagatcaa actaataatc tcttacataa actaaaaata 4620
tttcatatta gtcagtcaga agataaggca aatattttag acaaggatga gcatttttat 4680
ctagtatttg aggagtgcta ctttgagcta gcgaatatag tgcctcttta taacaaaatt 4740
agaaactata taactcaaaa gccatatagt gatgagaaat ttaagctcaa ttttgagaac 4800
tcgactttgg ctaatggttg ggataaaaat aaagagcctg acaatacggc aattttattt 4860
atcaaagatg ataaatatta tctgggtgtg atgaataaga aaaataacaa aatatttgat 4920
gataaagcta tcaaagaaaa taaaggcgag ggttataaaa aaattgttta taaactttta 4980
cctggcgcaa ataaaatgtt acctaaggtt ttcttttctg ctaaatctat aaaattttat 5040
aatcctagtg aagatatact tagaataaga aatcattcca cacatacaaa aaatggtagt 5100
cctcaaaaag gatatgaaaa atttgagttt aatattgaag attgccgaaa atttatagat 5160
ttttataaac agtctataag taagcatccg gagtggaaag attttggatt tagattttct 5220
gatactcaaa gatataattc tatagatgaa ttttatagag aagttgaaaa tcaaggctac 5280
aaactaactt ttgaaaatat atcagagagc tatattgata gcgtagttaa tcagggtaaa 5340
ttgtacctat tccaaatcta taataaagat ttttcagctt atagcaaagg gcgaccaaat 5400
ctacatactt tatattggaa agcgctgttt gatgagagaa atcttcaaga tgtggtttat 5460
aagctaaatg gtgaggcaga gcttttttat cgtaaacaat caatacctaa aaaaatcact 5520
cacccagcta aagaggcaat agctaataaa aacaaagata atcctaaaaa agagagtgtt 5580
tttgaatatg atttaatcaa agataaacgc tttactgaag ataagttttt ctttcactgt 5640
cctattacaa tcaattttaa atctagtgga gctaataagt ttaatgatga aatcaattta 5700
ttgctaaaag aaaaagcaaa tgatgttcat atattaagta tagatagagg tgaaagacat 5760
ttagcttact atactttggt agatggtaaa ggcaatatca tcaaacaaga tactttcaac 5820
atcattggta atgatagaat gaaaacaaac taccatgata agcttgctgc aatagagaaa 5880
gatagggatt cagctaggaa agactggaaa aagataaata acatcaaaga gatgaaagag 5940
ggctatctat ctcaggtagt tcatgaaata gctaagctag ttatagagta taatgctatt 6000
gtggtttttg aggatttaaa ttttggattt aaaagagggc gtttcaaggt agagaagcag 6060
gtctatcaaa agttagaaaa aatgctaatt gagaaactaa actatctagt tttcaaagat 6120
aatgagtttg ataaaactgg gggagtgctt agagcttatc agctaacagc accttttgag 6180
acttttaaaa agatgggtaa acaaacaggt attatctact atgtaccagc tggttttact 6240
tcaaaaattt gtcctgtaac tggttttgta aatcagttat atcctaagta tgaaagtgtc 6300
agcaaatctc aagagttctt tagtaagttt gacaagattt gttataacct tgataagggc 6360
tattttgagt ttagttttga ttataaaaac tttggtgaca aggctgccaa aggcaagtgg 6420
actatagcta gctttgggag tagattgatt aactttagaa attcagataa aaatcataat 6480
tgggatactc gagaagttta tccaactaaa gagttggaga aattgctaaa agattattct 6540
atcgaatatg ggcatggcga atgtatcaaa gcagctattt gcggtgagag cgacaaaaag 6600
ttttttgcta agctaactag tgtcctaaat actatcttac aaatgcgtaa ctcaaaaaca 6660
ggtactgagt tagattatct aatttcacca gtagcagatg taaatggcaa tttctttgat 6720
tcgcgacagg cgccaaaaaa tatgcctcaa gatgctgatg ccaatggtgc ttatcatatt 6780
gggctaaaag gtctgatgct actaggtagg atcaaaaata atcaagaggg caaaaaactc 6840
aatttggtta tcaaaaatga agagtatttt gagttcgtgc agaataggaa taactaaagt 6900
atattttaga tgaagattat ttcttaatct agacatgagc ggatacatat ttgaatgtat 6960
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgcatc 7020
gatttattat gacaacttga cggctacatc attcactttt tcttcacaac cggcacggaa 7080
ctcgctcggg ctggccccgg tgcatttttt aaatacccgc gagaagtaga gttgatcgtc 7140
aaaaccaaca ttgcgaccga cggtggcgat aggcatccgg gtggtgctca aaagcagctt 7200
cgcctggctg atacgttggt cctcgcgcca gcttaagacg ctaatcccta actgctggcg 7260
gaaaagatgt gacagacgcg acggcgacaa gcaaacatgc tgtgcgacgc tggcgatatc 7320
aaaattgctg tctgccaggt gatcgctgat gtactgacaa gcctcgcgta cccgattatc 7380
catcggtgga tggagcgact cgttaatcgc ttccatgcgc cgcagtaaca attgctcaag 7440
cagatttatc gccagcagct ccgaatagcg cccttcccct tgcccggcgt taatgatttg 7500
cccaaacagg tcgctgaaat gcggctggtg cgcttcatcc gggcgaaaga accccgtatt 7560
ggcaaatatt gacggccagt taagccattc atgccagtag gcgcgcggac gaaagtaaac 7620
ccactggtga taccattcgc gagcctccgg atgacgaccg tagtgatgaa tctctcctgg 7680
cgggaacagc aaaatatcac ccggtcggca aacaaattct cgtccctgat ttttcaccac 7740
cccctgaccg cgaatggtga gattgagaat ataacctttc attcccagcg gtcggtcgat 7800
aaaaaaatcg agataaccgt tggcctcaat cggcgttaaa cccgccacca gatgggcatt 7860
aaacgagtat cccggcagca ggggatcatt ttgcgcttca gccatacttt tcatactccc 7920
gccattcaga gaagaaacca attgtccata ttgcatcaga cattgccgtc actgcgtctt 7980
ttactggctc ttctcgctaa ccaaaccggt aaccccgctt attaaaagca ttctgtaaca 8040
aagcgggacc aaagccatga caaaaacgcg taacaaaagt gtctataatc acggcagaaa 8100
agtccacatt gattatttgc acggcgtcac actttgctat gccatagcat ttttatccat 8160
aagattagcg gatcctacct gacgcttttt atcgcaactc tctactgttt ctccataccc 8220
gtttttttgg gaattcgagc tctaaggagg ttataaaaaa tggatattaa tactgaaact 8280
gagatcaagc aaaagcattc actaaccccc tttcctgttt tcctaatcag cccggcattt 8340
cgcgggcgat attttcacag ctatttcagg agttcagcca tgaacgctta ttacattcag 8400
gatcgtcttg aggctcagag ctgggcgcgt cactaccagc agctcgcccg tgaagagaaa 8460
gaggcagaac tggcagacga catggaaaaa ggcctgcccc agcacctgtt tgaatcgcta 8520
tgcatcgatc atttgcaacg ccacggggcc agcaaaaaat ccattacccg tgcgtttgat 8580
gacgatgttg agtttcagga gcgcatggca gaacacatcc ggtacatggt tgaaaccatt 8640
gctcaccacc aggttgatat tgattcagag gtataaaacg aatgagtact gcactcgcaa 8700
cgctggctgg gaagctggct gaacgtgtcg gcatggattc tgtcgaccca caggaactga 8760
tcaccactct tcgccagacg gcatttaaag gtgatgccag cgatgcgcag ttcatcgcat 8820
tactgatcgt tgccaaccag tacggcctta atccgtggac gaaagaaatt tacgcctttc 8880
ctgataagca gaatggcatc gttccggtgg tgggcgttga tggctggtcc cgcatcatca 8940
atgaaaacca gcagtttgat ggcatggact ttgagcagga caatgaatcc tgtacatgcc 9000
ggatttaccg caaggaccgt aatcatccga tctgcgttac cgaatggatg gatgaatgcc 9060
gccgcgaacc attcaaaact cgcgaaggca gagaaatcac ggggccgtgg cagtcgcatc 9120
ccaaacggat gttacgtcat aaagccatga ttcagtgtgc ccgtctggcc ttcggatttg 9180
ctggtatcta tgacaaggat gaagccgagc gcattgtcga aaatactgca tacactgcag 9240
aacgtcagcc ggaacgcgac atcactccgg ttaacgatga aaccatgcag gagattaaca 9300
ctctgctgat cgccctggat aaaacatggg atgacgactt attgccgctc tgttcccaga 9360
tatttcgccg cgacattcgt gcatcgtcag aactgacaca ggccgaagca gtaaaagctc 9420
ttggattcct gaaacagaaa gccgcagagc agaaggtggc agcatgacac cggacattat 9480
cctgcagcgt accgggatcg atgtgagagc tgtcgaacag ggggatgatg cgtggcacaa 9540
attacggctc ggcgtcatca ccgcttcaga agttcacaac gtgatagcaa aaccccgctc 9600
cggaaagaag tggcctgaca tgaaaatgtc ctacttccac accctgcttg ctgaggtttg 9660
caccggtgtg gctccggaag ttaacgctaa agcactggcc tggggaaaac agtacgagaa 9720
cgacgccaga accctgtttg aattcacttc cggcgtgaat gttactgaat ccccgatcat 9780
ctatcgcgac gaaagtatgc gtaccgcctg ctctcccgat ggtttatgca gtgacggcaa 9840
cggccttgaa ctgaaatgcc cgtttacctc ccgggatttc atgaagttcc ggctcggtgg 9900
tttcgaggcc ataaagtcag cttacatggc ccaggtgcag tacagcatgt gggtgacgcg 9960
aaaaaatgcc tggtactttg ccaactatga cccgcgtatg aagcgtgaag gcctgcatta 10020
tgtcgtgatt gagcgggatg aaaagtacat ggcgagtttt gacgagatcg tgccggagtt 10080
catcgaaaaa atggacgagg cactggctga aattggtttt gtatttgggg agcaatggcg 10140
atgacgcatc ctcacgataa tatccgggta ggcgcaatca ctttcgtcta ctccgttaca 10200
aagcgaggct gggtatttcc cggcctttct gttatccgaa atccactgaa agcacagcgg 10260
ctggctgagg agataaataa taaacgaggg gctgtatgca caaagcatct tctgttgagt 10320
taagaacgag tatcgagatg gcacatagcc ttgctcaaat tggaatcagg tttgtgccaa 10380
taccagtaga aacagacgaa gaatccatgg gtatggacag atcctcttta ggcccgtagt 10440
ctgcaaatcc ttttatgatt ttctatcaaa caaaagagga aaatagacca gttgcaatcc 10500
aaacgagagt ctaatagaat gaggtcgaaa agtaaatcgc gcgggtttgt tactgataaa 10560
gcaggcaaga cctaaaatgt gtaaagggca aagtgtatac tttggcgtca ccccttacat 10620
attttaggtc tttttttatt gtgcgtaact aacttgccat cttcaaacag gagggctgga 10680
agaagcagac cgctaacaca gtacataaaa aaggagacat gaacgatgaa catcaaaaag 10740
tttgcaaaac aagcaacagt attaaccttt actaccgcac tgctggcagg aggcgcaact 10800
caagcgtttg cgaaagaaac gaaccaaaag ccatataagg aaacatacgg catttcccat 10860
attacacgcc atgatatgct gcaaatccct gaacagcaaa aaaatgaaaa atatcaagtt 10920
cctgaattcg attcgtccac aattaaaaat atctcttctg caaaaggcct ggacgtttgg 10980
gacagctggc cattacaaaa cgctgacggc actgtcgcaa actatcacgg ctaccacatc 11040
gtctttgcat tagccggaga tcctaaaaat gcggatgaca catcgattta catgttctat 11100
caaaaagtcg gcgaaacttc tattgacagc tggaaaaacg ctggccgcgt ctttaaagac 11160
agcgacaaat tcgatgcaaa tgattctatc ctaaaagacc aaacacaaga atggtcaggt 11220
tcagccacat ttacatctga cggaaaaatc cgtttattct acactgattt ctccggtaaa 11280
cattacggca aacaaacact gacaactgca caagttaacg tatcagcatc agacagctct 11340
ttgaacatca acggtgtaga ggattataaa tcaatctttg acggtgacgg aaaaacgtat 11400
caaaatgtac agcagttcat cgatgaaggc aactacagct caggcgacaa ccatacgctg 11460
agagatcctc actacgtaga agataaaggc cacaaatact tagtatttga agcaaacact 11520
ggaactgaag atggctacca aggcgaagaa tctttattta acaaagcata ctatggcaaa 11580
agcacatcat tcttccgtca agaaagtcaa aaacttctgc aaagcgataa aaaacgcacg 11640
gctgagttag caaacggcgc tctcggtatg attgagctaa acgatgatta cacactgaaa 11700
aaagtgatga aaccgctgat tgcatctaac acagtaacag atgaaattga acgcgcgaac 11760
gtctttaaaa tgaacggcaa atggtacctg ttcactgact cccgcggatc aaaaatgacg 11820
attgacggca ttacgtctaa cgatatttac atgcttggtt atgtttctaa ttctttaact 11880
ggcccataca agccgctgaa caaaactggc cttgtgttaa aaatggatct tgatcctaac 11940
gatgtaacct ttacttactc acacttcgct gtacctcaag cgaaaggaaa caatgtcgtg 12000
attacaagct atatgacaaa cagaggattc tacgcagaca aacaatcaac gtttgcgcca 12060
agcttcctgc tgaacatcaa aggcaagaaa acatctgttg tcaaagacag catccttgaa 12120
caaggacaat taacagttaa caaataaaaa cgcaaaagaa aatgccgata tcctattggc 12180
attttctttt atttcttatc aacataaagg tgaatcccat atgaactata taaaagcagg 12240
caaatggcta accgtattcc tcaaaaaaag caccgactcg gtgccacttt ttcaagttga 12300
taacggacta gccttatttt aacttgctat ttctagctct aaaacggttg gactcaagac 12360
gatagtatct acaacagtag aaatttggct tcagcagagc gcagatacat ctacaacagt 12420
agaaattatt taaagttctt agactacgac cagtctaaaa agcgcctgaa ttcgcgacct 12480
tctcgttact gacaggaaaa tgggccattg gcaaccaggg aaagatgaac gtgatgatgt 12540
tcacaatttg ctgaattgtg gtgatgtgat gctcaccgca tttcctgaaa attcacgctg 12600
tatcttgaaa aatcgacgtt ttttacgtgg ttttccgtcg aaaatttaag gtaagaacct 12660
gacctcgtga ttactatttc gccgtgttga cgacatcagg aggccagtat gaccgtatta 12720
catagtgtgg atttttttcc gtctggtaac gcgtccgtgg cgatagaacc ccggctcccg 12780
caggcggatt ttcctgaaca tcatcatgat tttcatgaaa ttgtgattgt cgaacatggc 12840
acgggtattc atgtgtttaa tgggcagccc tataccatca ccggtggcac ggtctgtttc 12900
gtacgcgatc atgatcggca tctgtatgaa cataccgata atctgtgtct gaccaatgtg 12960
ctgtatcgct cgccggatcg atttcagttt ctcgccgggc tgaatcagtt gctgccacaa 13020
gagctggatg ggcagtatcc gtctcactgg cgcgttaacc acagcgtatt gcagcaggtg 13080
cgacagctgg ttgcacagat ggaacagcag gaaggggaaa atgatttacc ctcgaccgcc 13140
agtcgcgaga tcttgtttat gcaattactg ctcttgctgc gtaaaagcag tttgcaggag 13200
aacctggaaa acagcgcatc acgtctcaac ttgcttctgg cctggctgga ggaccatttt 13260
gccgatgagg tgaattggga tgccgtggcg gatcaatttt ctctttcact gcgtacgcta 13320
catcggcagc ttaagcagca aacgggactg acgcctcagc gatacctgaa ccgcctgcga 13380
ctgatgaaag cccgacatct gctacgccac agcgaggcca gcgttactga catcgcctat 13440
cgctgtggat tcagcgacag taaccacttt tcgacgcttt ttcgccgaga gtttaactgg 13500
tcaccgcgtg atattcgcca gggacgggat ggctttctgc aataacgcga atcttctcaa 13560
cgtatttgta cgccatattg cgaataatca acttcgttct ctggccgagg tagccacggt 13620
ggcgcatcag ttaaaacttc tcaaagatga tttttttgcc agcgaccagc aggcagtcgc 13680
tgtggctgac cgttatccgc aagatgtctt tgctgaacat acacatgatt tttgtgagct 13740
ggtgattgtc tggcgcggta atggcctgca tgtactcaac gatcgccctt atcgcattac 13800
ccgtggcgat ctcttttaca ttcatgctga cgataaacac tcctacgctt ccgttaacga 13860
tctggttttg cagaatatta tttattgccc ggagcgtctg aagctgaatc ttgactggca 13920
gggggcgatt ccgggattta acgccagcgc agggcaacca cactggcgct taggtagcat 13980
ggggatggcg caggcgcggc aggttatcgg tcagcttgag catgaaagta gtcagcatgt 14040
gccgtttgct aacgaaatgg ctgagttgct gttcgggcag ttggtgatgt tgctgaatcg 14100
ccatcgttac accagtgatt cgttgccgcc aacatccagc gaaacgttgc tggataagct 14160
gattacccgg ctggcggcta gcctgaaaag tccctttgcg ctggataaat tttgtgatga 14220
ggcatcgtgc agtgagcgcg ttttgcgtca gcaatttcgc cagcagactg gaatgaccat 14280
caatcaatat ctgcgacagg tcagagtgtg tcatgcgcaa tatcttctcc agcatagccg 14340
cctgttaatc agtgatattt cgaccgaatg tggctttgaa gatagtaact atttttcggt 14400
ggtgtttacc cgggaaaccg ggatgacgcc cagccagtgg cgtcatctca attcgcagaa 14460
agattaattc gccatgccc 14479
<210> 2
<211> 14510
<212> DNA
<213> (人工序列)
<400> 2
catgggtatg gacagttttc cctttgatat gtaacggtga acagttgttc tacttttgtt 60
tgttagtctt gatgcttcac tgatagatac aagagccata agaacctcag atccttccgt 120
atttagccag tatgttctct agtgtggttc gttgtttttg cgtgagccat gagaacgaac 180
cattgagatc atgcttactt tgcatgtcac tcaaaaattt tgcctcaaaa ctggtgagct 240
gaatttttgc agttaaagca tcgtgtagtg tttttcttag tccgttacgt aggtaggaat 300
ctgatgtaat ggttgttggt attttgtcac cattcatttt tatctggttg ttctcaagtt 360
cggttacgag atccatttgt ctatctagtt caacttggaa aatcaacgta tcagtcgggc 420
ggcctcgctt atcaaccacc aatttcatat tgctgtaagt gtttaaatct ttacttattg 480
gtttcaaaac ccattggtta agccttttaa actcatggta gttattttca agcattaaca 540
tgaacttaaa ttcatcaagg ctaatctcta tatttgcctt gtgagttttc ttttgtgtta 600
gttcttttaa taaccactca taaatcctca tagagtattt gttttcaaaa gacttaacat 660
gttccagatt atattttatg aattttttta actggaaaag ataaggcaat atctcttcac 720
taaaaactaa ttctaatttt tcgcttgaga acttggcata gtttgtccac tggaaaatct 780
caaagccttt aaccaaagga ttcctgattt ccacagttct cgtcatcagc tctctggttg 840
ctttagctaa tacaccataa gcattttccc tactgatgtt catcatctga gcgtattggt 900
tataagtgaa cgataccgtc cgttctttcc ttgtagggtt ttcaatcgtg gggttgagta 960
gtgccacaca gcataaaatt agcttggttt catgctccgt taagtcatag cgactaatcg 1020
ctagttcatt tgctttgaaa acaactaatt cagacataca tctcaattgg tctaggtgat 1080
tttaatcact ataccaattg agatgggcta gtcaatgata attactagtc cttttccttt 1140
gagttgtggg tatctgtaaa ttctgctaga cctttgctgg aaaacttgta aattctgcta 1200
gaccctctgt aaattccgct agacctttgt gtgttttttt tgtttatatt caagtggtta 1260
taatttatag aataaagaaa gaataaaaaa agataaaaag aatagatccc agccctgtgt 1320
ataactcact actttagtca gttccgcagt attacaaaag gatgtcgcaa acgctgtttg 1380
ctcctctaca aaacagacct taaaacccta aaggcttaag tagcaccctc gcaagctcgg 1440
ttgcggccgc aatcgggcaa atcgctgaat attccttttg tctccgacca tcaggcacct 1500
gagtcgctgt ctttttcgtg acattcagtt cgctgcgctc acggctctgg cagtgaatgg 1560
gggtaaatgg cactacaggc gccttttatg gattcatgca aggaaactac ccataataca 1620
agaaaagccc gtcacgggct tctcagggcg ttttatggcg ggtctgctat gtggtgctat 1680
ctgacttttt gctgttcagc agttcctgcc ctctgatttt ccagtctgac cacttcggat 1740
tatcccgtga caggtcattc agactggcta atgcacccag taaggcagcg gtatcatcaa 1800
cccactgcag caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 1860
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 1920
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 1980
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 2040
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 2100
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 2160
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 2220
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 2280
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 2340
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 2400
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 2460
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 2520
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 2580
aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat 2640
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgatg 2700
atatattttt atcttgtgca atgtaacatc agagattttg agacacaacg tggctttccc 2760
tgcagctgaa caatacttaa tactatagaa tgataacaaa ataaactact ttttaaaaga 2820
attttgtgtt ataatctatt tattattaag tattgggtaa tattttttga agagatattt 2880
tgaaaaagaa aaattaaagc atattaaact aatttcggag gtcattaaaa ctattattga 2940
aatcatcaaa ctcattatgg atttaattta aactttttat tttaggaggc aaaaatgtca 3000
atttatcaag aatttgttaa taaatatagt ttaagtaaaa ctctaagatt tgagttaatc 3060
ccacagggta aaacacttga aaacataaaa gcaagaggtt tgattttaga tgatgagaaa 3120
agagctaaag actacaaaaa ggctaaacaa ataattgata aatatcatca gttttttata 3180
gaggagatat taagttcggt ttgtattagc gaagatttat tacaaaacta ttctgatgtt 3240
tattttaaac ttaaaaagag tgatgatgat aatctacaaa aagattttaa aagtgcaaaa 3300
gatacgataa agaaacaaat atctgaatat ataaaggact cagagaaatt taagaatttg 3360
tttaatcaaa accttatcga tgctaaaaaa gggcaagagt cagatttaat tctatggcta 3420
aagcaatcta aggataatgg tatagaacta tttaaagcca atagtgatat cacagatata 3480
gatgaggcgt tagaaataat caaatctttt aaaggttgga caacttattt taagggtttt 3540
catgaaaata gaaaaaatgt ttatagtagc aatgatattc ctacatctat tatttatagg 3600
atagtagatg ataatttgcc taaatttcta gaaaataaag ctaagtatga gagtttaaaa 3660
gacaaagctc cagaagctat aaactatgaa caaattaaaa aagatttggc agaagagcta 3720
acctttgata ttgactacaa aacatctgaa gttaatcaaa gagttttttc acttgatgaa 3780
gtttttgaga tagcaaactt taataattat ctaaatcaaa gtggtattac taaatttaat 3840
actattattg gtggtaaatt tgtaaatggt gaaaatacaa agagaaaagg tataaatgaa 3900
tatataaatc tatactcaca gcaaataaat gataaaacac tcaaaaaata taaaatgagt 3960
gttttattta agcaaatttt aagtgataca gaatctaaat cttttgtaat tgataagtta 4020
gaagatgata gtgatgtagt tacaacgatg caaagttttt atgagcaaat agcagctttt 4080
aaaacagtag aagaaaaatc tattaaagaa acactatctt tattatttga tgatttaaaa 4140
gctcaaaaac ttgatttgag taaaatttat tttaaaaatg ataaatctct tactgatcta 4200
tcacaacaag tttttgatga ttatagtgtt attggtacag cggtactaga atatataact 4260
caacaaatag cacctaaaaa tcttgataac cctagtaaga aagagcaaga attaatagcc 4320
aaaaaaactg aaaaagcaaa atacttatct ctagaaacta taaagcttgc cttagaagaa 4380
tttaataagc atagagatat agataaacag tgtaggtttg aagaaatact tgcaaacttt 4440
gcggctattc cgatgatatt tgatgaaata gctcaaaaca aagacaattt ggcacagata 4500
tctatcaaat atcaaaatca aggtaaaaaa gacctacttc aagctagtgc ggaagatgat 4560
gttaaagcta tcaaggatct tttagatcaa actaataatc tcttacataa actaaaaata 4620
tttcatatta gtcagtcaga agataaggca aatattttag acaaggatga gcatttttat 4680
ctagtatttg aggagtgcta ctttgagcta gcgaatatag tgcctcttta taacaaaatt 4740
agaaactata taactcaaaa gccatatagt gatgagaaat ttaagctcaa ttttgagaac 4800
tcgactttgg ctaatggttg ggataaaaat aaagagcctg acaatacggc aattttattt 4860
atcaaagatg ataaatatta tctgggtgtg atgaataaga aaaataacaa aatatttgat 4920
gataaagcta tcaaagaaaa taaaggcgag ggttataaaa aaattgttta taaactttta 4980
cctggcgcaa ataaaatgtt acctaaggtt ttcttttctg ctaaatctat aaaattttat 5040
aatcctagtg aagatatact tagaataaga aatcattcca cacatacaaa aaatggtagt 5100
cctcaaaaag gatatgaaaa atttgagttt aatattgaag attgccgaaa atttatagat 5160
ttttataaac agtctataag taagcatccg gagtggaaag attttggatt tagattttct 5220
gatactcaaa gatataattc tatagatgaa ttttatagag aagttgaaaa tcaaggctac 5280
aaactaactt ttgaaaatat atcagagagc tatattgata gcgtagttaa tcagggtaaa 5340
ttgtacctat tccaaatcta taataaagat ttttcagctt atagcaaagg gcgaccaaat 5400
ctacatactt tatattggaa agcgctgttt gatgagagaa atcttcaaga tgtggtttat 5460
aagctaaatg gtgaggcaga gcttttttat cgtaaacaat caatacctaa aaaaatcact 5520
cacccagcta aagaggcaat agctaataaa aacaaagata atcctaaaaa agagagtgtt 5580
tttgaatatg atttaatcaa agataaacgc tttactgaag ataagttttt ctttcactgt 5640
cctattacaa tcaattttaa atctagtgga gctaataagt ttaatgatga aatcaattta 5700
ttgctaaaag aaaaagcaaa tgatgttcat atattaagta tagatagagg tgaaagacat 5760
ttagcttact atactttggt agatggtaaa ggcaatatca tcaaacaaga tactttcaac 5820
atcattggta atgatagaat gaaaacaaac taccatgata agcttgctgc aatagagaaa 5880
gatagggatt cagctaggaa agactggaaa aagataaata acatcaaaga gatgaaagag 5940
ggctatctat ctcaggtagt tcatgaaata gctaagctag ttatagagta taatgctatt 6000
gtggtttttg aggatttaaa ttttggattt aaaagagggc gtttcaaggt agagaagcag 6060
gtctatcaaa agttagaaaa aatgctaatt gagaaactaa actatctagt tttcaaagat 6120
aatgagtttg ataaaactgg gggagtgctt agagcttatc agctaacagc accttttgag 6180
acttttaaaa agatgggtaa acaaacaggt attatctact atgtaccagc tggttttact 6240
tcaaaaattt gtcctgtaac tggttttgta aatcagttat atcctaagta tgaaagtgtc 6300
agcaaatctc aagagttctt tagtaagttt gacaagattt gttataacct tgataagggc 6360
tattttgagt ttagttttga ttataaaaac tttggtgaca aggctgccaa aggcaagtgg 6420
actatagcta gctttgggag tagattgatt aactttagaa attcagataa aaatcataat 6480
tgggatactc gagaagttta tccaactaaa gagttggaga aattgctaaa agattattct 6540
atcgaatatg ggcatggcga atgtatcaaa gcagctattt gcggtgagag cgacaaaaag 6600
ttttttgcta agctaactag tgtcctaaat actatcttac aaatgcgtaa ctcaaaaaca 6660
ggtactgagt tagattatct aatttcacca gtagcagatg taaatggcaa tttctttgat 6720
tcgcgacagg cgccaaaaaa tatgcctcaa gatgctgatg ccaatggtgc ttatcatatt 6780
gggctaaaag gtctgatgct actaggtagg atcaaaaata atcaagaggg caaaaaactc 6840
aatttggtta tcaaaaatga agagtatttt gagttcgtgc agaataggaa taactaaagt 6900
atattttaga tgaagattat ttcttaatct agacatgagc ggatacatat ttgaatgtat 6960
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgcatc 7020
gatttattat gacaacttga cggctacatc attcactttt tcttcacaac cggcacggaa 7080
ctcgctcggg ctggccccgg tgcatttttt aaatacccgc gagaagtaga gttgatcgtc 7140
aaaaccaaca ttgcgaccga cggtggcgat aggcatccgg gtggtgctca aaagcagctt 7200
cgcctggctg atacgttggt cctcgcgcca gcttaagacg ctaatcccta actgctggcg 7260
gaaaagatgt gacagacgcg acggcgacaa gcaaacatgc tgtgcgacgc tggcgatatc 7320
aaaattgctg tctgccaggt gatcgctgat gtactgacaa gcctcgcgta cccgattatc 7380
catcggtgga tggagcgact cgttaatcgc ttccatgcgc cgcagtaaca attgctcaag 7440
cagatttatc gccagcagct ccgaatagcg cccttcccct tgcccggcgt taatgatttg 7500
cccaaacagg tcgctgaaat gcggctggtg cgcttcatcc gggcgaaaga accccgtatt 7560
ggcaaatatt gacggccagt taagccattc atgccagtag gcgcgcggac gaaagtaaac 7620
ccactggtga taccattcgc gagcctccgg atgacgaccg tagtgatgaa tctctcctgg 7680
cgggaacagc aaaatatcac ccggtcggca aacaaattct cgtccctgat ttttcaccac 7740
cccctgaccg cgaatggtga gattgagaat ataacctttc attcccagcg gtcggtcgat 7800
aaaaaaatcg agataaccgt tggcctcaat cggcgttaaa cccgccacca gatgggcatt 7860
aaacgagtat cccggcagca ggggatcatt ttgcgcttca gccatacttt tcatactccc 7920
gccattcaga gaagaaacca attgtccata ttgcatcaga cattgccgtc actgcgtctt 7980
ttactggctc ttctcgctaa ccaaaccggt aaccccgctt attaaaagca ttctgtaaca 8040
aagcgggacc aaagccatga caaaaacgcg taacaaaagt gtctataatc acggcagaaa 8100
agtccacatt gattatttgc acggcgtcac actttgctat gccatagcat ttttatccat 8160
aagattagcg gatcctacct gacgcttttt atcgcaactc tctactgttt ctccataccc 8220
gtttttttgg gaattcgagc tctaaggagg ttataaaaaa tggatattaa tactgaaact 8280
gagatcaagc aaaagcattc actaaccccc tttcctgttt tcctaatcag cccggcattt 8340
cgcgggcgat attttcacag ctatttcagg agttcagcca tgaacgctta ttacattcag 8400
gatcgtcttg aggctcagag ctgggcgcgt cactaccagc agctcgcccg tgaagagaaa 8460
gaggcagaac tggcagacga catggaaaaa ggcctgcccc agcacctgtt tgaatcgcta 8520
tgcatcgatc atttgcaacg ccacggggcc agcaaaaaat ccattacccg tgcgtttgat 8580
gacgatgttg agtttcagga gcgcatggca gaacacatcc ggtacatggt tgaaaccatt 8640
gctcaccacc aggttgatat tgattcagag gtataaaacg aatgaaccaa atcgtgaagt 8700
tcactgacga ctctggcctg gcggttcaag ttactccaga cgatgttcgc cgttatatct 8760
gtgagaacgc tactgaaaaa gaggtgggcc tctttctgca actctgtcag actcaacgtc 8820
tgaatccgtt tgtgaaagac gcttacctgg tgaaatacgg cggtgctcca gcttctatga 8880
ttacttccta tcaagttttt aaccgtcgcg cgtgtcgtga tgctaactat gatggtatca 8940
aatctggtgt ggttgttctg cgtgacggtg atgttgtgca taaacgtggt gctgcgtgct 9000
acaaaaaggc gggtgaggag ctcatcggtg gttgggcgga agttcgcttt aaggatggcc 9060
gcgagactgc gtatgctgag gtggcgctcg acgactattc caccggcaaa tctaattggg 9120
cgaaaatgcc gggtgttatg atcgaaaaat gcgcgaaggc tgctgcttgg cgcctcgcgt 9180
tcccggacac ttttcagggc atgtacgctg cggaggaaat ggatcaagcg caacagccag 9240
aacaggtgcg cgctcaggcg gagcaaccag tggatctcca gccaatccgc gaactcttca 9300
agccatattg cgaacacttc ggcatcactc cggctgaggg tatgactgct gtttgtggtg 9360
cggtgggcgc tgaaggcatg cactctatga ccgagcagca agctcgccgt gctcgcgctt 9420
ggatggagga agaaatggct gcgccagctg tggaagcgga gtatgaggtt gttgacgaag 9480
gcgaggtgtt ttaaatgaca ccggacatta tcctgcagcg taccgggatc gatgtgagag 9540
ctgtcgaaca gggggatgat gcgtggcaca aattacggct cggcgtcatc accgcttcag 9600
aagttcacaa cgtgatagca aaaccccgct ccggaaagaa gtggcctgac atgaaaatgt 9660
cctacttcca caccctgctt gctgaggttt gcaccggtgt ggctccggaa gttaacgcta 9720
aagcactggc ctggggaaaa cagtacgaga acgacgccag aaccctgttt gaattcactt 9780
ccggcgtgaa tgttactgaa tccccgatca tctatcgcga cgaaagtatg cgtaccgcct 9840
gctctcccga tggtttatgc agtgacggca acggccttga actgaaatgc ccgtttacct 9900
cccgggattt catgaagttc cggctcggtg gtttcgaggc cataaagtca gcttacatgg 9960
cccaggtgca gtacagcatg tgggtgacgc gaaaaaatgc ctggtacttt gccaactatg 10020
acccgcgtat gaagcgtgaa ggcctgcatt atgtcgtgat tgagcgggat gaaaagtaca 10080
tggcgagttt tgacgagatc gtgccggagt tcatcgaaaa aatggacgag gcactggctg 10140
aaattggttt tgtatttggg gagcaatggc gatgacgcat cctcacgata atatccgggt 10200
aggcgcaatc actttcgtct actccgttac aaagcgaggc tgggtatttc ccggcctttc 10260
tgttatccga aatccactga aagcacagcg gctggctgag gagataaata ataaacgagg 10320
ggctgtatgc acaaagcatc ttctgttgag ttaagaacga gtatcgagat ggcacatagc 10380
cttgctcaaa ttggaatcag gtttgtgcca ataccagtag aaacagacga agaatccatg 10440
ggtatggaca gatcctcttt aggcccgtag tctgcaaatc cttttatgat tttctatcaa 10500
acaaaagagg aaaatagacc agttgcaatc caaacgagag tctaatagaa tgaggtcgaa 10560
aagtaaatcg cgcgggtttg ttactgataa agcaggcaag acctaaaatg tgtaaagggc 10620
aaagtgtata ctttggcgtc accccttaca tattttaggt ctttttttat tgtgcgtaac 10680
taacttgcca tcttcaaaca ggagggctgg aagaagcaga ccgctaacac agtacataaa 10740
aaaggagaca tgaacgatga acatcaaaaa gtttgcaaaa caagcaacag tattaacctt 10800
tactaccgca ctgctggcag gaggcgcaac tcaagcgttt gcgaaagaaa cgaaccaaaa 10860
gccatataag gaaacatacg gcatttccca tattacacgc catgatatgc tgcaaatccc 10920
tgaacagcaa aaaaatgaaa aatatcaagt tcctgaattc gattcgtcca caattaaaaa 10980
tatctcttct gcaaaaggcc tggacgtttg ggacagctgg ccattacaaa acgctgacgg 11040
cactgtcgca aactatcacg gctaccacat cgtctttgca ttagccggag atcctaaaaa 11100
tgcggatgac acatcgattt acatgttcta tcaaaaagtc ggcgaaactt ctattgacag 11160
ctggaaaaac gctggccgcg tctttaaaga cagcgacaaa ttcgatgcaa atgattctat 11220
cctaaaagac caaacacaag aatggtcagg ttcagccaca tttacatctg acggaaaaat 11280
ccgtttattc tacactgatt tctccggtaa acattacggc aaacaaacac tgacaactgc 11340
acaagttaac gtatcagcat cagacagctc tttgaacatc aacggtgtag aggattataa 11400
atcaatcttt gacggtgacg gaaaaacgta tcaaaatgta cagcagttca tcgatgaagg 11460
caactacagc tcaggcgaca accatacgct gagagatcct cactacgtag aagataaagg 11520
ccacaaatac ttagtatttg aagcaaacac tggaactgaa gatggctacc aaggcgaaga 11580
atctttattt aacaaagcat actatggcaa aagcacatca ttcttccgtc aagaaagtca 11640
aaaacttctg caaagcgata aaaaacgcac ggctgagtta gcaaacggcg ctctcggtat 11700
gattgagcta aacgatgatt acacactgaa aaaagtgatg aaaccgctga ttgcatctaa 11760
cacagtaaca gatgaaattg aacgcgcgaa cgtctttaaa atgaacggca aatggtacct 11820
gttcactgac tcccgcggat caaaaatgac gattgacggc attacgtcta acgatattta 11880
catgcttggt tatgtttcta attctttaac tggcccatac aagccgctga acaaaactgg 11940
ccttgtgtta aaaatggatc ttgatcctaa cgatgtaacc tttacttact cacacttcgc 12000
tgtacctcaa gcgaaaggaa acaatgtcgt gattacaagc tatatgacaa acagaggatt 12060
ctacgcagac aaacaatcaa cgtttgcgcc aagcttcctg ctgaacatca aaggcaagaa 12120
aacatctgtt gtcaaagaca gcatccttga acaaggacaa ttaacagtta acaaataaaa 12180
acgcaaaaga aaatgccgat atcctattgg cattttcttt tatttcttat caacataaag 12240
gtgaatccca tatgaactat ataaaagcag gcaaatggct aaccgtattc ctcaaaaaaa 12300
gcaccgactc ggtgccactt tttcaagttg ataacggact agccttattt taacttgcta 12360
tttctagctc taaaacggtt ggactcaaga cgatagtatc tacaacagta gaaatttggc 12420
ttcagcagag cgcagataca tctacaacag tagaaattat ttaaagttct tagactacga 12480
ccagtctaaa aagcgcctga attcgcgacc ttctcgttac tgacaggaaa atgggccatt 12540
ggcaaccagg gaaagatgaa cgtgatgatg ttcacaattt gctgaattgt ggtgatgtga 12600
tgctcaccgc atttcctgaa aattcacgct gtatcttgaa aaatcgacgt tttttacgtg 12660
gttttccgtc gaaaatttaa ggtaagaacc tgacctcgtg attactattt cgccgtgttg 12720
acgacatcag gaggccagta tgaccgtatt acatagtgtg gatttttttc cgtctggtaa 12780
cgcgtccgtg gcgatagaac cccggctccc gcaggcggat tttcctgaac atcatcatga 12840
ttttcatgaa attgtgattg tcgaacatgg cacgggtatt catgtgttta atgggcagcc 12900
ctataccatc accggtggca cggtctgttt cgtacgcgat catgatcggc atctgtatga 12960
acataccgat aatctgtgtc tgaccaatgt gctgtatcgc tcgccggatc gatttcagtt 13020
tctcgccggg ctgaatcagt tgctgccaca agagctggat gggcagtatc cgtctcactg 13080
gcgcgttaac cacagcgtat tgcagcaggt gcgacagctg gttgcacaga tggaacagca 13140
ggaaggggaa aatgatttac cctcgaccgc cagtcgcgag atcttgttta tgcaattact 13200
gctcttgctg cgtaaaagca gtttgcagga gaacctggaa aacagcgcat cacgtctcaa 13260
cttgcttctg gcctggctgg aggaccattt tgccgatgag gtgaattggg atgccgtggc 13320
ggatcaattt tctctttcac tgcgtacgct acatcggcag cttaagcagc aaacgggact 13380
gacgcctcag cgatacctga accgcctgcg actgatgaaa gcccgacatc tgctacgcca 13440
cagcgaggcc agcgttactg acatcgccta tcgctgtgga ttcagcgaca gtaaccactt 13500
ttcgacgctt tttcgccgag agtttaactg gtcaccgcgt gatattcgcc agggacggga 13560
tggctttctg caataacgcg aatcttctca acgtatttgt acgccatatt gcgaataatc 13620
aacttcgttc tctggccgag gtagccacgg tggcgcatca gttaaaactt ctcaaagatg 13680
atttttttgc cagcgaccag caggcagtcg ctgtggctga ccgttatccg caagatgtct 13740
ttgctgaaca tacacatgat ttttgtgagc tggtgattgt ctggcgcggt aatggcctgc 13800
atgtactcaa cgatcgccct tatcgcatta cccgtggcga tctcttttac attcatgctg 13860
acgataaaca ctcctacgct tccgttaacg atctggtttt gcagaatatt atttattgcc 13920
cggagcgtct gaagctgaat cttgactggc agggggcgat tccgggattt aacgccagcg 13980
cagggcaacc acactggcgc ttaggtagca tggggatggc gcaggcgcgg caggttatcg 14040
gtcagcttga gcatgaaagt agtcagcatg tgccgtttgc taacgaaatg gctgagttgc 14100
tgttcgggca gttggtgatg ttgctgaatc gccatcgtta caccagtgat tcgttgccgc 14160
caacatccag cgaaacgttg ctggataagc tgattacccg gctggcggct agcctgaaaa 14220
gtccctttgc gctggataaa ttttgtgatg aggcatcgtg cagtgagcgc gttttgcgtc 14280
agcaatttcg ccagcagact ggaatgacca tcaatcaata tctgcgacag gtcagagtgt 14340
gtcatgcgca atatcttctc cagcatagcc gcctgttaat cagtgatatt tcgaccgaat 14400
gtggctttga agatagtaac tatttttcgg tggtgtttac ccgggaaacc gggatgacgc 14460
ccagccagtg gcgtcatctc aattcgcaga aagattaatt cgccatgccc 14510
<210> 3
<211> 3181
<212> DNA
<213> (人工序列)
<400> 3
tcgagttcat gtgcagctcc atcagcaaaa ggggatgata agtttatcac caccgactat 60
ttgcaacagt gccgttgatc gtgctatgat cgactgatgt catcagcggt ggagtgcaat 120
gtcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 180
atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 240
ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 300
gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 360
agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 420
cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 480
ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 540
gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 600
caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 660
gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 720
ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 780
tatcagcccg tcatacttga agctagacag gcttatcttg gacaagaaga agatcgcttg 840
gcctcgcgcg cagatcagtt ggaagaattt gtccactacg tgaaaggcga gatcaccaag 900
gtagtcggca aataagatgc cgctcgccag tcgattggct gagctcatga agttcctatt 960
ccgaagttcc gcgaacgcgt aaaggatcta ggtgaagatc ctttttgata atctcatgac 1020
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1080
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1140
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1200
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1260
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1320
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1380
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1440
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1500
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1560
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1620
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1680
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 1740
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 1800
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 1860
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatgctg 1920
gatccttgac agctagctca gtcctaggta taatactagt agaggtagag acgcgaggtc 1980
taagaacttt aaataatttc tactgttgta gatagagacc gtgaagttaa taaggtctca 2040
aatttctact gttgtagatc gtctctgaac tgattcaagc aagcttaaac ccagctcaat 2100
gagctgggtt ttttgtttgt tttttcaaac ttagttagct tggccttatt aacgttgata 2160
taatttaaat tttatttgac aaaaatgggc tcgtgttgta caataaatgt agtgatagcg 2220
gtaccctcga agctgtcacc ggatgtgctt tccggtctga tgagtccgtg aggacgaaac 2280
agcctctaca aataattttg tttaatagag ggtaagtaaa agaaaggagg tttattttat 2340
gagcaaagga gaagaacttt tcactggagt tgtcccaatt cttgttgaat tagatggtga 2400
tgttaatggg cacaaatttt ctgtccgtgg agagggtgaa ggtgatgcta caaacggaaa 2460
actcaccctt aaatttattt gcactactgg aaaactacct gttccgtggc caacacttgt 2520
cactactctg acctatggtg ttcaatgctt ttcccgttat ccggatcaca tgaaacggca 2580
tgactttttc aagagtgcca tgcccgaagg ttatgtacag gaacgcacta tatctttcaa 2640
agatgacggg acctacaaga cgcgtgctga agtcaagttt gaaggtgata cccttgttaa 2700
tcgtatcgag ttaaagggta ttgattttaa agaagatgga aacattcttg gacacaaact 2760
cgagtacaac tttaactcac acaatgtata catcacggca gacaaacaaa agaatggaat 2820
caaagctaac ttcaaaattc gccacaacgt tgaagatggt tccgttcaac tagcagacca 2880
ttatcaacaa aatactccaa ttggcgatgg ccctgtcctt ttaccagaca accattacct 2940
gtcgacacaa tctgtccttt cgaaagatcc caacgaaaag cgtgaccaca tggtccttct 3000
tgagtttgta actgctgctg ggattacaca tggcatggat gagctctaca aataacgaac 3060
ggcagatcag aattttgtaa taaaaaaaga gcctgctcat tacactgcgg gctctttttc 3120
atggtcagaa gacgggtaac caagataaca aagcttagat ctattaccct gttatcccta 3180
c 3181
<210> 4
<211> 3903
<212> DNA
<213> (人工序列)
<400> 4
atgtcaattt atcaagaatt tgttaataaa tatagtttaa gtaaaactct aagatttgag 60
ttaatcccac agggtaaaac acttgaaaac ataaaagcaa gaggtttgat tttagatgat 120
gagaaaagag ctaaagacta caaaaaggct aaacaaataa ttgataaata tcatcagttt 180
tttatagagg agatattaag ttcggtttgt attagcgaag atttattaca aaactattct 240
gatgtttatt ttaaacttaa aaagagtgat gatgataatc tacaaaaaga ttttaaaagt 300
gcaaaagata cgataaagaa acaaatatct gaatatataa aggactcaga gaaatttaag 360
aatttgttta atcaaaacct tatcgatgct aaaaaagggc aagagtcaga tttaattcta 420
tggctaaagc aatctaagga taatggtata gaactattta aagccaatag tgatatcaca 480
gatatagatg aggcgttaga aataatcaaa tcttttaaag gttggacaac ttattttaag 540
ggttttcatg aaaatagaaa aaatgtttat agtagcaatg atattcctac atctattatt 600
tataggatag tagatgataa tttgcctaaa tttctagaaa ataaagctaa gtatgagagt 660
ttaaaagaca aagctccaga agctataaac tatgaacaaa ttaaaaaaga tttggcagaa 720
gagctaacct ttgatattga ctacaaaaca tctgaagtta atcaaagagt tttttcactt 780
gatgaagttt ttgagatagc aaactttaat aattatctaa atcaaagtgg tattactaaa 840
tttaatacta ttattggtgg taaatttgta aatggtgaaa atacaaagag aaaaggtata 900
aatgaatata taaatctata ctcacagcaa ataaatgata aaacactcaa aaaatataaa 960
atgagtgttt tatttaagca aattttaagt gatacagaat ctaaatcttt tgtaattgat 1020
aagttagaag atgatagtga tgtagttaca acgatgcaaa gtttttatga gcaaatagca 1080
gcttttaaaa cagtagaaga aaaatctatt aaagaaacac tatctttatt atttgatgat 1140
ttaaaagctc aaaaacttga tttgagtaaa atttatttta aaaatgataa atctcttact 1200
gatctatcac aacaagtttt tgatgattat agtgttattg gtacagcggt actagaatat 1260
ataactcaac aaatagcacc taaaaatctt gataacccta gtaagaaaga gcaagaatta 1320
atagccaaaa aaactgaaaa agcaaaatac ttatctctag aaactataaa gcttgcctta 1380
gaagaattta ataagcatag agatatagat aaacagtgta ggtttgaaga aatacttgca 1440
aactttgcgg ctattccgat gatatttgat gaaatagctc aaaacaaaga caatttggca 1500
cagatatcta tcaaatatca aaatcaaggt aaaaaagacc tacttcaagc tagtgcggaa 1560
gatgatgtta aagctatcaa ggatctttta gatcaaacta ataatctctt acataaacta 1620
aaaatatttc atattagtca gtcagaagat aaggcaaata ttttagacaa ggatgagcat 1680
ttttatctag tatttgagga gtgctacttt gagctagcga atatagtgcc tctttataac 1740
aaaattagaa actatataac tcaaaagcca tatagtgatg agaaatttaa gctcaatttt 1800
gagaactcga ctttggctaa tggttgggat aaaaataaag agcctgacaa tacggcaatt 1860
ttatttatca aagatgataa atattatctg ggtgtgatga ataagaaaaa taacaaaata 1920
tttgatgata aagctatcaa agaaaataaa ggcgagggtt ataaaaaaat tgtttataaa 1980
cttttacctg gcgcaaataa aatgttacct aaggttttct tttctgctaa atctataaaa 2040
ttttataatc ctagtgaaga tatacttaga ataagaaatc attccacaca tacaaaaaat 2100
ggtagtcctc aaaaaggata tgaaaaattt gagtttaata ttgaagattg ccgaaaattt 2160
atagattttt ataaacagtc tataagtaag catccggagt ggaaagattt tggatttaga 2220
ttttctgata ctcaaagata taattctata gatgaatttt atagagaagt tgaaaatcaa 2280
ggctacaaac taacttttga aaatatatca gagagctata ttgatagcgt agttaatcag 2340
ggtaaattgt acctattcca aatctataat aaagattttt cagcttatag caaagggcga 2400
ccaaatctac atactttata ttggaaagcg ctgtttgatg agagaaatct tcaagatgtg 2460
gtttataagc taaatggtga ggcagagctt ttttatcgta aacaatcaat acctaaaaaa 2520
atcactcacc cagctaaaga ggcaatagct aataaaaaca aagataatcc taaaaaagag 2580
agtgtttttg aatatgattt aatcaaagat aaacgcttta ctgaagataa gtttttcttt 2640
cactgtccta ttacaatcaa ttttaaatct agtggagcta ataagtttaa tgatgaaatc 2700
aatttattgc taaaagaaaa agcaaatgat gttcatatat taagtataga tagaggtgaa 2760
agacatttag cttactatac tttggtagat ggtaaaggca atatcatcaa acaagatact 2820
ttcaacatca ttggtaatga tagaatgaaa acaaactacc atgataagct tgctgcaata 2880
gagaaagata gggattcagc taggaaagac tggaaaaaga taaataacat caaagagatg 2940
aaagagggct atctatctca ggtagttcat gaaatagcta agctagttat agagtataat 3000
gctattgtgg tttttgagga tttaaatttt ggatttaaaa gagggcgttt caaggtagag 3060
aagcaggtct atcaaaagtt agaaaaaatg ctaattgaga aactaaacta tctagttttc 3120
aaagataatg agtttgataa aactggggga gtgcttagag cttatcagct aacagcacct 3180
tttgagactt ttaaaaagat gggtaaacaa acaggtatta tctactatgt accagctggt 3240
tttacttcaa aaatttgtcc tgtaactggt tttgtaaatc agttatatcc taagtatgaa 3300
agtgtcagca aatctcaaga gttctttagt aagtttgaca agatttgtta taaccttgat 3360
aagggctatt ttgagtttag ttttgattat aaaaactttg gtgacaaggc tgccaaaggc 3420
aagtggacta tagctagctt tgggagtaga ttgattaact ttagaaattc agataaaaat 3480
cataattggg atactcgaga agtttatcca actaaagagt tggagaaatt gctaaaagat 3540
tattctatcg aatatgggca tggcgaatgt atcaaagcag ctatttgcgg tgagagcgac 3600
aaaaagtttt ttgctaagct aactagtgtc ctaaatacta tcttacaaat gcgtaactca 3660
aaaacaggta ctgagttaga ttatctaatt tcaccagtag cagatgtaaa tggcaatttc 3720
tttgattcgc gacaggcgcc aaaaaatatg cctcaagatg ctgatgccaa tggtgcttat 3780
catattgggc taaaaggtct gatgctacta ggtaggatca aaaataatca agagggcaaa 3840
aaactcaatt tggttatcaa aaatgaagag tattttgagt tcgtgcagaa taggaataac 3900
taa 3903
<210> 5
<211> 417
<212> DNA
<213> (人工序列)
<400> 5
atggatatta atactgaaac tgagatcaag caaaagcatt cactaacccc ctttcctgtt 60
ttcctaatca gcccggcatt tcgcgggcga tattttcaca gctatttcag gagttcagcc 120
atgaacgctt attacattca ggatcgtctt gaggctcaga gctgggcgcg tcactaccag 180
cagctcgccc gtgaagagaa agaggcagaa ctggcagacg acatggaaaa aggcctgccc 240
cagcacctgt ttgaatcgct atgcatcgat catttgcaac gccacggggc cagcaaaaaa 300
tccattaccc gtgcgtttga tgacgatgtt gagtttcagg agcgcatggc agaacacatc 360
cggtacatgg ttgaaaccat tgctcaccac caggttgata ttgattcaga ggtataa 417
<210> 6
<211> 786
<212> DNA
<213> (人工序列)
<400> 6
atgagtactg cactcgcaac gctggctggg aagctggctg aacgtgtcgg catggattct 60
gtcgacccac aggaactgat caccactctt cgccagacgg catttaaagg tgatgccagc 120
gatgcgcagt tcatcgcatt actgatcgtt gccaaccagt acggccttaa tccgtggacg 180
aaagaaattt acgcctttcc tgataagcag aatggcatcg ttccggtggt gggcgttgat 240
ggctggtccc gcatcatcaa tgaaaaccag cagtttgatg gcatggactt tgagcaggac 300
aatgaatcct gtacatgccg gatttaccgc aaggaccgta atcatccgat ctgcgttacc 360
gaatggatgg atgaatgccg ccgcgaacca ttcaaaactc gcgaaggcag agaaatcacg 420
gggccgtggc agtcgcatcc caaacggatg ttacgtcata aagccatgat tcagtgtgcc 480
cgtctggcct tcggatttgc tggtatctat gacaaggatg aagccgagcg cattgtcgaa 540
aatactgcat acactgcaga acgtcagccg gaacgcgaca tcactccggt taacgatgaa 600
accatgcagg agattaacac tctgctgatc gccctggata aaacatggga tgacgactta 660
ttgccgctct gttcccagat atttcgccgc gacattcgtg catcgtcaga actgacacag 720
gccgaagcag taaaagctct tggattcctg aaacagaaag ccgcagagca gaaggtggca 780
gcatga 786
<210> 7
<211> 681
<212> DNA
<213> (人工序列)
<400> 7
atgacaccgg acattatcct gcagcgtacc gggatcgatg tgagagctgt cgaacagggg 60
gatgatgcgt ggcacaaatt acggctcggc gtcatcaccg cttcagaagt tcacaacgtg 120
atagcaaaac cccgctccgg aaagaagtgg cctgacatga aaatgtccta cttccacacc 180
ctgcttgctg aggtttgcac cggtgtggct ccggaagtta acgctaaagc actggcctgg 240
ggaaaacagt acgagaacga cgccagaacc ctgtttgaat tcacttccgg cgtgaatgtt 300
actgaatccc cgatcatcta tcgcgacgaa agtatgcgta ccgcctgctc tcccgatggt 360
ttatgcagtg acggcaacgg ccttgaactg aaatgcccgt ttacctcccg ggatttcatg 420
aagttccggc tcggtggttt cgaggccata aagtcagctt acatggccca ggtgcagtac 480
agcatgtggg tgacgcgaaa aaatgcctgg tactttgcca actatgaccc gcgtatgaag 540
cgtgaaggcc tgcattatgt cgtgattgag cgggatgaaa agtacatggc gagttttgac 600
gagatcgtgc cggagttcat cgaaaaaatg gacgaggcac tggctgaaat tggttttgta 660
tttggggagc aatggcgatg a 681
<210> 8
<211> 813
<212> DNA
<213> (人工序列)
<400> 8
atgaaccaaa tcgtgaagtt cactgacgac tctggcctgg cggttcaagt tactccagac 60
gatgttcgcc gttatatctg tgagaacgct actgaaaaag aggtgggcct ctttctgcaa 120
ctctgtcaga ctcaacgtct gaatccgttt gtgaaagacg cttacctggt gaaatacggc 180
ggtgctccag cttctatgat tacttcctat caagttttta accgtcgcgc gtgtcgtgat 240
gctaactatg atggtatcaa atctggtgtg gttgttctgc gtgacggtga tgttgtgcat 300
aaacgtggtg ctgcgtgcta caaaaaggcg ggtgaggagc tcatcggtgg ttgggcggaa 360
gttcgcttta aggatggccg cgagactgcg tatgctgagg tggcgctcga cgactattcc 420
accggcaaat ctaattgggc gaaaatgccg ggtgttatga tcgaaaaatg cgcgaaggct 480
gctgcttggc gcctcgcgtt cccggacact tttcagggca tgtacgctgc ggaggaaatg 540
gatcaagcgc aacagccaga acaggtgcgc gctcaggcgg agcaaccagt ggatctccag 600
ccaatccgcg aactcttcaa gccatattgc gaacacttcg gcatcactcc ggctgagggt 660
atgactgctg tttgtggtgc ggtgggcgct gaaggcatgc actctatgac cgagcagcaa 720
gctcgccgtg ctcgcgcttg gatggaggaa gaaatggctg cgccagctgt ggaagcggag 780
tatgaggttg ttgacgaagg cgaggtgttt taa 813

Claims (6)

1.一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统,其特征在于,所述大肠杆菌基因编辑系统包括:
质粒pEcCpf1和质粒pcrEG;
或质粒pEcCpf1H和质粒pcrEG;
质粒pEcCpf1通过将pEcCas载体上的Cas9蛋白替换为Cpf1蛋白,靶向基因pMB1的sgRNA替换为靶向基因pMB1的crRNA序列得到,其中,所述质粒pEcCpf1上连接有编码λ-Red重组酶系的基因,所述λ-Red重组酶系包括Gam蛋白、Bet蛋白和Exo蛋白;
质粒pcrEG通过将pTarget载体上的sgRNA插入区替换为crRNA插入区,并插入sfgfp基因得到;
所述质粒pEcCpf1H通过将质粒pEcCpf1中的λ-Red重组酶系替换成CspRecT蛋白得到;
其中,质粒pEcCpf1的核苷酸序列如SEQ ID NO.1所示,质粒pEcCpf1H的核苷酸序列如SEQ ID NO.2所示,质粒pcrEG的核苷酸序列如SEQ ID NO.3所示。
2.权利要求1所述的大肠杆菌基因编辑系统在大肠杆菌基因编辑中的应用。
3.根据权利要求2所述的应用,其特征在于:质粒pEcCpf1和质粒pcrEG构成的基因编辑系统用于大肠杆菌的基因敲除和基因整合。
4.根据权利要求2所述的应用,其特征在于:质粒pEcCpf1H和质粒pcrEG构成的基因编辑系统用于大肠杆菌的基因敲除、碱基编辑或多基因编辑。
5.根据权利要求2所述的应用,其特征在于:同源臂连接在质粒pcrEG上。
6.根据权利要求2所述的应用,其特征在于:采用化转法将质粒pEcCpf1和质粒pcrEG转化入大肠杆菌中,采用电转法将质粒pEcCpf1H和质粒pcrEG转化入大肠杆菌中。
CN202210209559.XA 2022-03-03 2022-03-03 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用 Active CN114457100B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210209559.XA CN114457100B (zh) 2022-03-03 2022-03-03 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210209559.XA CN114457100B (zh) 2022-03-03 2022-03-03 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用

Publications (2)

Publication Number Publication Date
CN114457100A CN114457100A (zh) 2022-05-10
CN114457100B true CN114457100B (zh) 2023-06-09

Family

ID=81416526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210209559.XA Active CN114457100B (zh) 2022-03-03 2022-03-03 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用

Country Status (1)

Country Link
CN (1) CN114457100B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115927423A (zh) * 2022-08-16 2023-04-07 大连理工大学 一种提高CRISPR/Cas基因编辑效率的方法
CN116751799B (zh) * 2023-06-14 2024-01-26 江南大学 一种多位点双重碱基编辑器及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109666684A (zh) * 2018-12-25 2019-04-23 北京化工大学 一种CRISPR/Cas12a基因编辑系统及其应用
CN109706109A (zh) * 2019-01-30 2019-05-03 中国医学科学院病原生物学研究所 一种基于CRISPR/Cas和lambda Red重组系统的体内质粒编辑系统及其应用
AU2020232850A1 (en) * 2019-03-07 2021-10-07 The Trustees Of Columbia University In The City Of New York RNA-guided DNA integration using Tn7-like transposons
CN112980891B (zh) * 2019-12-16 2023-12-12 中国科学院分子植物科学卓越创新中心 一种基于CRISPR-Cas的大肠杆菌基因组编辑工具
CN113621638A (zh) * 2021-09-02 2021-11-09 浙江华睿生物技术有限公司 构建产l-丝氨酸大肠杆菌的方法

Also Published As

Publication number Publication date
CN114457100A (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN114457100B (zh) 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用
CN109486737B (zh) 一种高产l-色氨酸的重组大肠杆菌及其构建方法
DK2855662T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
CN107641631A (zh) 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法
DK2678432T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
TW201233798A (en) Recombinant microorganisms and methods of use thereof
CN106591344A (zh) 一种融合分子伴侣标签的大肠杆菌热诱导可溶性蛋白表达载体及其应用
KR20200086303A (ko) 숙주 세포에서의 향미 화합물 생산
CN110964678B (zh) 一种合成法尼烯的基因工程菌及其构建方法与应用
CN112430617A (zh) 用于谷氨酸棒杆菌基因改造的带有阴性筛选标记的质粒
CN101603023B (zh) 一株温控共表达外源基因的重组大肠杆菌及其应用
CN107849579A (zh) 用于基因优化的方法
KR102194740B1 (ko) 7-adca 제조를 위한 데아세트옥시세팔로스포린 c의 고농도 생산 재조합 아크레모니움 크리소제눔 균주의 제조방법 및 이 방법으로 제조된 균주
CN109554322B (zh) 一种高产l-苏氨酸的重组大肠杆菌及其构建方法
CN107502619B (zh) 一组干酪乳杆菌基因敲除载体及其应用
CN110734926A (zh) 一种内切葡聚糖酶表达载体及其构建方法与应用
CN112080493B (zh) 制备串联重复dna的方法及相关生物材料与应用
KR101936825B1 (ko) 이소프렌의 생산 방법
CN101993885A (zh) 一种新型高效重组质粒载体及其应用
CN110964680B (zh) 利用纤维素制备金合欢烯的工程菌株及方法
CN116103284A (zh) 环形gRNA及其相关生物材料与应用
CN110964679B (zh) 一种利用纤维素制备金合欢烯的工程菌株及方法
CN110964681B (zh) 一种利用纤维素制备金合欢烯的工程菌株及方法
KR102244489B1 (ko) 유박테리움 칼란데리용 유전체 편집 벡터, 이를 이용한 유박테리움 칼란데리 유전체 편집 방법 및 이를 이용하여 형질전환 된 유박테리움 칼란데리 균주

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant