CN110951770B - 一种简单快速高效的CRISPR/Cas9载体构建方法及应用 - Google Patents

一种简单快速高效的CRISPR/Cas9载体构建方法及应用 Download PDF

Info

Publication number
CN110951770B
CN110951770B CN201911205309.3A CN201911205309A CN110951770B CN 110951770 B CN110951770 B CN 110951770B CN 201911205309 A CN201911205309 A CN 201911205309A CN 110951770 B CN110951770 B CN 110951770B
Authority
CN
China
Prior art keywords
vector
target
sequence
primer
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911205309.3A
Other languages
English (en)
Other versions
CN110951770A (zh
Inventor
林拥军
黄维峰
周菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Agricultural University
Original Assignee
Huazhong Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Agricultural University filed Critical Huazhong Agricultural University
Priority to CN201911205309.3A priority Critical patent/CN110951770B/zh
Publication of CN110951770A publication Critical patent/CN110951770A/zh
Application granted granted Critical
Publication of CN110951770B publication Critical patent/CN110951770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种简单快速高效的CRISPR/Cas9载体构建方法及应用,包括:构建骨架载体并对骨架载体进行线性化处理得到线性化的骨架载体,制备靶点引物后将所述靶点引物接入所述线性化的骨架载体中得到连接产物,将所述连接产物转接至大肠杆菌后得到阳性CRISPR/Cas9载体;其中,所述骨架载体连接有OsU3启动子或OsU6b启动子、gRNA1及Bsa I酶切位点,所述gRNA1上5’端的碱基5’‑gtttt‑3’被删除;所述靶点引物可包含一个或多个靶点引物片段,并通过粘性末端设计与骨架载体连接。本发明的有益效果是该方法适用于单双靶点CRISPR/Cas9载体的构建;利用Bsa I线性化的载体和酶切回收的外源片段可以长期存放于,用于大量CRISPR/Cas9载体构建。本载体系统构建CRISPR/Cas9降低了外源片段突变概率,可以确保重组质粒测序正确率为100%。

Description

一种简单快速高效的CRISPR/Cas9载体构建方法及应用
技术领域
本发明属于分子生物学,具体涉及一种简单快速高效的CRISPR/Cas9载体构建方法及应用。
背景技术
CRISPR(clustered regularly interspaced short palindromic repeats)/Cas(CRISPR-associated gene)系统最早是在Streptococcus pyogenes细菌中发现的,它是一种原核免疫系统,通过选择性的靶向和破坏外源DNA如病毒来保护细胞。CRISPR/Cas9是一种基于II型CRISPR的高效基因编辑系统,主要有3个组分:Cas9蛋白、tracrRNA和pre-crRNA。CRISPR/Cas9系统在植物基因编辑中应用广泛。自从2013年成功用于拟南芥、烟草和水稻的基因编辑以来,CRISPR/Cas9在水稻、小麦、烟草、拟南芥、高粱、番茄、玉米、马铃薯、杨树、大豆、大麦、苔藓、甘蓝、甜橙、苹果、苔藓、葡萄、莴苣、棉花、莲藕、蒲公英、亚麻、矮牵牛、柑橘、西瓜、蘑菇、油菜和梨树中实现编辑功能(Zhang et al 2017)。CRISPR/Cas9被认为是第三代基因编辑工具,Cas9在sgRNA的引导下,可以对靶标序列的双链进行切割,使DNA双链断裂,从而激活细胞的DNA双链断裂修复功能。在修复过程中,会发生少量碱基的替换、缺失或插入,从而导致基因的编辑。基因被编辑以后,可以采用PCR产物测序法鉴定基因型。由于测序之前并不知道基因型,所以对多个家系测序,以获得理想的编辑材料;同时测序质量的好坏也会影响对基因型的判断,所以需要重复测序最终才能确定基因型;此外由于DNA序列存在复杂结构,可能导致测序失败。因此,PCR产物测序法是一种费时费力的基因型鉴定方法。
为了简单快速鉴定CRISPR/Cas9编辑体的基因型,很多学者用两个靶点去编辑一个基因,当一个DNA序列上有两个位置发生双链断裂后,中间的片段可能发生丢失,从而只需要在靶点上下游设计引物,进行PCR扩增后,将PCR产物进行琼脂糖凝胶电泳即可鉴定编辑体的基因型。Enciso-Rodriguez等利用CRISPR/Cas9双靶点敲除马铃薯S-RNase,在T0代成功获得了10株中间片段丢失的突变体,缺失片段达到580bp。在拟南芥中,利用这种双靶点CRISPR/Cas9敲除策略,成功删除了1.7~13kbDNA片段。在水稻中可以删除0.2~245kb的DNA片段,而删除430bp的DNA片段的概率高达22.2%。所以说双靶点敲除单个基因是一种易于检测且高效的基因编辑方法。
目前在植物中,主要采用以下4种方法来构建双靶点CRISPR/Cas9载体,第1种,Golden Gate组装。刘耀光课题组通过边切边连(Bsa I酶切,T4连接酶连接)、重叠延伸PCR制备两个两端带有Bsa I酶切位点的sgRNA表达盒,然后利用“边切边连”法组装sgRNA表达盒到pYLCRISPR/Cas9载体上。朱健康课题组的方法是先将多个设计好的靶点DNA小片段用T4 DNA连接酶构建到BbsI线性化的sgRNA入门载体上,然后用不同的限制性内切酶将相应的sgRNA表达盒切下来,最后用Golden Gate的方法将多个sgRNA表达盒连接到CRISPR/Cas9载体上。第2种,Gibson组装。研究者们首先通过PCR制备sgRNA表达盒,然后将纯化好的PCR产物与线性化的载体混合,加入混合酶反应。第3种,Golden Gate和Gateway联用法。该方法分为3步,第1步将设计好的靶点用T4 DNA连接酶构建到含有不同启动子的Golden Gate入门载体中;第2步利用Golden Gate方法将多个sgRNA表达盒构建到具有Gateway重组位点的中间载体上;第3步用Gateway重组法将Cas9蛋白、上一步中的多个sgRNA表达盒以及驱动Cas9表达的启动子构建到最终的表达载体上。第4种,同源重组法。首先通过两轮PCR将同源臂、tRNAGly、sgRNA1和靶点扩增到一起,然后将最终的PCR片段利用一步法克隆到Bsa I线性化的表达载体上。以上的方法用于CRISPR/Cas9载体构建时,操作复杂,耗时长,需要经验丰富的科研人员才能顺利完成。
发明内容
解决现有技术中CRISPR/Cas9载体构建时,操作复杂,耗时长的技术问题,本发明提供一种简单快速高效的CRISPR/Cas9载体构建方法及应用。
具体技术方案如下:
一种简单快速高效的CRISPR/Cas9载体构建方法,其不同之处在于,所述CRISPR/Cas9载体构建方法包括:
构建骨架载体并对骨架载体进行线性化处理得到线性化的骨架载体,制备靶点引物后将所述靶点引物接入所述线性化的骨架载体中得到连接产物,将所述连接产物转接至大肠杆菌后依次进行培养、抽提质粒,得到阳性CRISPR/Cas9载体;其中,所述骨架载体连接有OsU3启动子或OsU6b启动子、gRNA1及Bsa I酶切位点,所述gRNA1上5’端的碱基5’-gtttt-3’被删除;
所述靶点引物包含一个或多个靶点引物片段:
当所述靶点引物包含一个靶点引物片段时,所述靶点引物片段的正向靶点引物的5’端序列为ggca或gttg,所述靶点引物片段序列的正向引物3’端序列为gtttt,所述靶点引物片段序列的反向靶点引物的5’端序列为ctctaaaac;
当所述靶点引物包含多个引物片段时,第一个靶点引物片段序列的正向靶点引物的5’端序列为ggca或gttg,最后一个靶点引物片段序列的正向引物3’端序列为gtttt,最后一个靶点引物片段序列的反向靶点引物的5’端序列为ctctaaaac,各个所述靶点引物片段之间通过制备的外源片段进行连接。
进一步,所述gRNA1从pYLgRNA-OsU3上扩增出来得到5’端碱基5’-gtttt-3被删除的gRNA1,扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ IDNO.11。
进一步,所述骨架载体上连接有ccdB表达盒,所述Bsa I酶切位点在ccdB的两端。
进一步,所述骨架载体连接有OsU3启动子时、gRNA1、ccdB表达盒及Bsa I酶切位点时,得到的骨架载体为pRC3骨架载体;
所述骨架载体连接有OsU6b启动子、gRNA1、ccdB表达盒及Bsa I酶切位点时,得到的骨架载体为pRC6b骨架载体;
所述pRC3骨架载体序列如SEQ ID NO.1所示;
所述pRC6b骨架载体序列如SEQ ID NO.2所示。
进一步,当所述靶点引物包含一个靶点引物片段时,所述靶点引物片段的正向靶点引物的5’端序列为ggca时,所述靶点引物构建至所述pRC3骨架载体上,所述靶点引物片段的正向靶点引物的5’端序列为gttg时,所述靶点引物构建至所述pRC6b骨架载体上;
当所述靶点引物包含多个靶点引物片段时,第一个靶点引物片段序列的正向靶点引物的5’端序列为ggca时,所述靶点引物构建至所述pRC3骨架载体上;第一个靶点引物片段序列的正向靶点引物的5’端序列为gttg时,所述靶点引物构建至所述pRC6b骨架载体上。
进一步,所述线性化的骨架载体包括Pu粘性末端及gRNA1粘性末端,所述Pu粘性末端的序列为ccgt或caac,所述gRNA1粘性末端序列为agag。
上述简单快速高效的CRISPR/Cas9载体构建方法在构建单靶点CRISPR/Cas9载体中的应用,其特征在于,包括以下步骤:
步骤A1:构建骨架载体;
步骤A2:制备靶点引物;
步骤A3:对所述骨架载体进行线性化处理,得到线性化的骨架载体;
步骤A4:将所述步骤A2靶点引物变性退火,形成带粘性末端的靶点接头,再与所述线性化的骨架载体进行连接,得到连接产物;
步骤A5:将所述连接产物转接至大肠杆菌后依次进行培养、抽提质粒,酶切验证得到阳性CRISPR/Cas9载体。
上述简单快速高效的CRISPR/Cas9载体构建方法在构建多靶点CRISPR/Cas9载体中的应用,其特征在于,包括以下步骤:
步骤B1:构建骨架载体;
步骤B2:制备靶点引物;
步骤B3:制备外源片段;
步骤B4:对所述骨架载体进行线性化处理,得到线性化的骨架载体;
步骤B5:将所述步骤A2靶点引物变性退火,形成带粘性末端的靶点接头,再与所述线性化的骨架载体及所述外源片段进行连接,得到连接产物;
步骤B6:将所述连接产物转接至大肠杆菌后依次进行培养、抽提质粒,酶切验证得到阳性CRISPR/Cas9载体;
其中,所述步骤B3包括如下步骤:
步骤B3-1:包含所述外源片段的载体制备:将和启动子PU6a以及LacZ表达盒构建到克隆载体pEASY-Blunt3上得到外源片段载体pGLU6a,所述pGLU6a的序列如SEQ ID NO.3所示;
步骤B3-2:外源片段提取,将所述外源片段载体采用Bsa I酶进行酶切,凝胶电泳后回收得到外源片段。
进一步,所述靶点引物包含两个靶点引物片段;
其中,所述第一靶点引物片段正向引物的5’端序列为ggca或gttg,所述第一靶点引物片段反向引物的5’端序列为aaac;所述第二靶点引物片段正向引物的5’端序列为gccg,所述第二靶点引物片段正向引物的3’端序列为gtttt,所述第二靶点引物片段反向引物的5’端序列为ctctaaaac。
上述CRISPR/Cas9载体构建方法在水稻基因的CRISPR/Cas9载体构建中的应用。
与现技术相比,本发明的有益效果是:(1)为基因编辑建立了一种简单快速高效的CRISPR/Cas9载体构建的方法,且该方法不仅适用于单靶点,而且适用于双靶点甚至多靶点的CRISPR/Cas9载体的构建,在双靶点及多靶点的CRISPR/Cas9载体的构建中其高效简便性相较于传统方法更为显著;(2)利用Bsa I线性化的载体和酶切回收的外源片段gRNA2-LacZ-PU6a可以长期存放于-20℃,不用每次制备,非常方便用于大量CRISPR/Cas9载体构建。同时在外源片段上引入LacZ报告基因,阳性克隆可以在含有卡那霉素、IPTG和X-gal的LB培养皿上显蓝色,进一步提高了阳性克隆率。(3)本载体系统构建CRISPR/Cas9载体不需要经过PCR过程,大大降低了外源片段的突变概率,可以确保重组质粒测序正确率为100%。
附图说明
图1是骨架载体pRC3的载体图;
图2是骨架载体pRC6b的载体图;
图3是pGLU6a的载体图;
图4是双靶点CRISPR/Cas9载体构建流程图;
图5是10个水稻基因的双靶点CRISPR/Cas9载体酶切胶图与单靶点CRISPR/Cas9载体酶切胶图;
其中,A-双靶点构建到pRC3,B-双靶点构建到pRC6b,M-表示DNA分子标记,C-OsCYO1单靶点CRISPR/Cas9载体酶切胶图,D-OsSKIPa的单靶点CRISPR/Cas9载体酶切胶图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
CRISPR/Cas9载体构建方法应用于单靶点CRISPR/Cas9载体的构建,步骤如下:
步骤A1:构建骨架载体;
骨架载体pRC3由以下步骤制得:
将OsU3启动子(PU3)和gRNA1从pYLgRNA-OsU3上扩增出来,所述gRNA1从pYLgRNA-OsU3上扩增出来,扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ ID NO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg
将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU3、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC3;所述pRC3骨架载体序列如SEQ ID NO.1所示;
骨架载体由RC6b以下步骤制得:
将OsU6b启动子(PU6b)从pYLgRNA-OsU6b上扩增出来;
所述gRNA1从pYLgRNA-OsU3上扩增出来,将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU6b、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC6b。所述pRC6b骨架载体序列如SEQ ID NO.2所示。
扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ IDNO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg步骤A2:制备靶点引物
设计靶点。
用软件CRISPR-P 2.0(Liu et al 2017)选择第一个碱基是g的靶点。在正向靶点引物的5’端加gtt,得到5’端为gttg的序列,3’端加gtttt,反向靶点引物的5’端加ctctaaaac,然后构建到pRC6b上。
用软件CRISPR-P 2.0(Liu et al 2017)选择第一个碱基是G的靶点。在正向靶点引物的5’端加ggc,得到5’端为ggca的序列,3’端加gtttt,反向靶点引物的5’端加ctctaaaac,然后构建到pRC3上。
步骤A3:线性化载体。
Bsa I线性化pRC6b,灭活备用。酶切体系为:载体3μg,10×Cutsmart Buffer 5μl,30U Bsa I,ddH2O补至50μl,37℃酶切1h。所述线性化骨架载体包括Pu粘性末端及gRNA1粘性末端,Pu粘性末端的序列为caac或ccgt,所述gRNA1粘性末端序列为agag;
步骤A4:
所述步骤A2靶点引物变性退火,形成带粘性末端的双链靶点接头,再与所述线性化骨架载体进行连接,得到连接产物;
将两条靶点引物混合在一起,变性退火后,将0.2μL靶点引物(浓度为1μmol/L)和80ng Bsa I线性化载体pRC6b混合在一起,总共20μL反应体系(2μL 10 x NEB T4 DNAligase buffer,80U T4 DNA ligase),利用PCR仪10℃5min,20℃5min,反应10-15个循环。连接产物转化大肠杆菌Trans1-T1。
步骤A5
连接产物转化大肠杆菌Trans1-T1。
CRISPR/Cas9载体构建方法应用于双靶点CRISPR/Cas9载体的构建,步骤如下:
步骤B1:构建骨架载体;
骨架载体pRC3由以下步骤制得:
将OsU3启动子(PU3)和gRNA1从pYLgRNA-OsU3上扩增出来,所述gRNA1从pYLgRNA-OsU3上扩增出来,扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ ID NO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg
将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU3、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC3;所述pRC3骨架载体序列如SEQ ID NO.1所示;
架载体由RC6b以下步骤制得:
将OsU6b启动子(PU6b)从pYLgRNA-OsU6b上扩增出来;
所述gRNA1从pYLgRNA-OsU3上扩增出来,将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU6b、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC6b。所述pRC6b骨架载体序列如SEQ ID NO.2所示。
扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ IDNO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg
步骤B2:制备靶点引物
设计靶点。
用软件CRISPR-P 2.0(Liu et al 2017)来选择两个靶点引物片段,第一靶点引物片段的第一个碱基必须是a或g,第二靶点引物片段的第一个碱基必须是g。靶点第一个碱基是a,则在5’端加上序列为ggc,得到5’端为ggca的序列,然后构建到pRC3上,第一靶点引物片段的第一个碱基是g,则在5’端加上序列为gtt,得到5’端为gttg的序列,然后构建到pRC6b上。选择好20-nt的靶点后,给两个靶点加好相应的碱基接头。
得到如下序列的引物片段:
如果靶点1的第一个碱基是a,则第一靶点引物片段正向引物序列如SEQ ID NO.4所示、第一靶点引物片段反向引物如SEQ ID NO.5所示、如果靶点1的第一个碱基是G,则第一靶点引物片段正向引物序列如SEQ ID NO.8所示、第一靶点引物片段反向引物如SEQ IDNO.9所示
第二靶点引物片段正向引物序列如SEQ ID NO.6所示、第二靶点引物片段正向引物序列如SEQ ID NO.7所示。
SEQ ID NO.4:ggcannnnnnnnnnnnnnnnnnn
SEQ ID NO.5:aaacnnnnnnnnnnnnnnnnnnn
SEQ ID NO.6:gccgnnnnnnnnnnnnnnnnnnngtttt
SEQ ID NO.7:ctctaaaacnnnnnnnnnnnnnnnnnnn
SEQ ID NO.8:gttgnnnnnnnnnnnnnnnnnnn
SEQ ID NO.9:aaacnnnnnnnnnnnnnnnnnnn
步骤B3:
步骤B3-1:包含所述外源片段的载体制备:
制备提供外源片段gRNA2-LacZ-PU6a的载体pGLU6a由以下步骤制得:
以引物gRNA-F和gRNA-R进行PCR,将gRNA2从pYLgRNA-OsU6a扩增出来;
以引物LacZ-F和LacZ-R进行PCR,将LacZ表达盒从pYL322d2(Zhu et al 2017)扩增出来;
以引物U6a-F和U6a-R进行PCR,将启动子PU6a从pYLgRNA-OsU6a扩增出来;
通过重叠延伸PCR将gRNA2、LacZ表达盒和PU6a连接成为一个DNA片段,最后克隆到pEASY-Blunt3载体上,构建为提供外源片段gRNA2-LacZ-PU6a的载体pGLU6a。
步骤B3-2:外源片段提取,
在靶点引物合成之前,用限制性内切酶Bsa I酶切pGLU6a,跑1%-1.5%琼脂糖凝胶,利用DNA纯化回收试剂盒回收外源片段gRNA2-LacZ-PU6a。NanoDrop2000测好浓度后,-20℃保存备用。
步骤B4:
线性化载体。Bsa I线性化pRC3或pRC6b,灭活备用。酶切体系为:载体3μg,10×Cutsmart Buffer 5μl,30U Bsa I,ddH2O补至50μl,37℃酶切1h。所述线性化骨架载体包括Pu粘性末端及gRNA1粘性末端,pRC3的Pu粘性末端的序列为ccgt,pRC6b的Pu粘性末端的序列为caac,所述gRNA1粘性末端序列为agag;
步骤B5:
连接产物的制备
制备靶点接头。靶点引物合成后,将靶点引物用ddH2O溶解成100μmol/L母液,各取1μl加入到98μl ddH2O混合稀释到1μmol/L。90℃,变性30sec,移至室温冷却完成退火。
连接反应。将0.2或0.5μl靶点引物(浓度为1μmol/L),15或30ng外源片段gRNA2-LacZ-PU6a和80或160ng Bsa I线性化载体pRC3或pRC6b,利用NEB T4 DNA ligase连接,20μl反应体系(2μl 10×NEB T4 DNA ligase buffer,80U T4 DNA ligase),利用PCR仪10℃5min,20℃5min,反应10~15个循环。
步骤B6
连接产物转化大肠杆菌Trans1-T1。
基于粘性末端互补配对,使用T4 DNA连接酶将多个外源片段一次性构建到线性化的载体上时,要求外源片段5’端的粘性末端与载体或者相邻的上游外源片段的3’端的粘性末端是互补配对的,并且多个外源片段和载体上的粘性末端不能重复,否则,具有重复粘性末端的外源片段就会相互竞争,导致外源片段的连接不按设计的方式进行,从而使得载体构建失败。构建双靶点CRISPR/Cas9载体,就需要将两个靶点和两个gRNA(其中gRNA1已经构建到载体骨架上)连接在一起,但gRNA是保守序列,按照传统方法设计粘性末端时,gRNA1和gRNA2的5’粘性末端就会重复,导致一次性连接多个外源片段不能进行。
本方法用正向引物和反向引物扩增gRNA1时,会删除gRNA1上5’端的5个碱基5’-GTTTT-3’,因此在合成第二个靶点序列时,需要将5’-GTTTT-3’添加到添加到第二个靶点的3’末端,这样既保证了多个粘性末端的差异性,又使得载体在构建完成后,gRNA1恢复成完整的序列。
本载体系统非常高效。载体上的克隆位点携带有ccdB致死基因,ccdB编码一个毒素蛋白,可以使Trans-T1大肠杆菌致死,克隆失败的菌株在LB平板上长不出来,从而大幅度提高重组质粒的阳性率。同时在外源片段上引入LacZ报告基因,阳性克隆可以在含有卡那霉素,IPTG和X-gal的LB培养皿上显蓝色,进一步提高了阳性克隆率。
实施例一
CRISPR/Cas9载体构建方法应用于单靶点CRISPR/Cas9载体的构建,步骤如下:
步骤A1
骨架载体由RC6b以下步骤制得:
将OsU6b启动子(PU6b)从pYLgRNA-OsU6b上扩增出来;
所述gRNA1从pYLgRNA-OsU3上扩增出来,将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU6b、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC6b。所述pRC6b骨架载体序列如SEQ ID NO.2所示。
扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ IDNO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg
步骤A2
设计靶点。
对OsCYO1和OsSKIPa用软件CRISPR-P 2.0(Liu et al 2017)选择第一个碱基是g的靶点。在正向靶点引物的5’端加gtt,3’端加gtttt,反向靶点引物的5’端加ctctaaaac,得到引物序列如表1所示
表1 OsCYO1和OsSKIPa单靶点CRISPR/Cas9载体构建引物
Figure BDA0002296809760000131
步骤A3:线性化骨架载体。
Bsa I线性化pRC6b,灭活备用。酶切体系为:载体3μg,10×Cutsmart Buffer 5μl,30U Bsa I,ddH2O补至50μl,37℃酶切1h。所述线性化骨架载体包括Pu粘性末端及gRNA1粘性末端,pRC6b的Pu粘性末端的序列为caac,所述gRNA1粘性末端序列为agag;
步骤A4:将所述步骤A2靶点引物变性退火,形成带粘性末端的双链靶点接头,再与所述线性化骨架载体进行连接,得到连接产物;
将两条靶点引物混合在一起,变性退火后,将0.2μL靶点引物(浓度为1μmol/L)和80ng Bsa I线性化载体pRC6b混合在一起,总共20μL反应体系(2μL 10 x NEB T4 DNAligase buffer,80U T4 DNA ligase),利用PCR仪10℃5min,20℃5min,反应10-15个循环。连接产物转化大肠杆菌Trans1-T1。
步骤A5:连接产物转化大肠杆菌Trans1-T1。
随机挑取8个单菌落,经碱裂解法抽提质粒,用Mlu I和BamH I酶切验证,结果显示阳性率为100%(图5),阳性质粒送测序,结果显示序列无突变。这些结果说明本载体系统也可以高效的构建单靶点CRISPR/Cas9载体。
实施例二
水稻基因的双靶点CRISPR/Cas9载体构建
步骤B1:构建骨架载体;
骨架载体pRC3由以下步骤制得:
将OsU3启动子(PU3)和gRNA1从pYLgRNA-OsU3上扩增出来,所述gRNA1从pYLgRNA-OsU3上扩增出来,扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ ID NO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU3、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC3;所述pRC3骨架载体序列如SEQ ID NO.1所示;
架载体由RC6b以下步骤制得:
将OsU6b启动子(PU6b)从pYLgRNA-OsU6b上扩增出来;
所述gRNA1从pYLgRNA-OsU3上扩增出来,将ccdB表达盒从DS355上扩增出来(两端带有Bsa I酶切位点);
将PU6b、ccdB表达盒和gRNA1克隆到载体pYLCRISPR/Cas9Pubi-H上,形成骨架载体pRC6b。所述pRC6b骨架载体序列如SEQ ID NO.2所示。
扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ IDNO.11。
SEQ ID NO.10:tacacagccagtctgcaggtggtctcgagagctagaaatagcaa
SEQ ID NO.11:gagaggcgcgccaatgataccgacgcgtccatccactccaagctcttg
步骤B2:制备靶点引物
设计靶点。
用软件CRISPR-P 2.0(Liu et al 2017)来选择两个靶点引物片段,第一靶点引物片段的第一个碱基必须是a或g,第二靶点引物片段的第一个碱基必须是g。靶点第一个碱基是a,则在5’端加上序列为ggc,得到5’端为ggca的序列,然后构建到pRC3上,第一靶点引物片段的第一个碱基是g,则在5’端加上序列为gtt,得到5’端为gttg的序列,然后构建到pRC6b上。选择好20-nt的靶点后,给两个靶点加好相应的碱基接头。
本研究针对10个已报道的水稻基因YS83、YGL2、TCD5、OsFLN1、YSA、OsCYO1、NTRC、OsClpP5、OsTLP27和OsSKIPa,每个基因分别设计3对靶点引物(表2),构建到pRC3和pRC6b上,共计20个载体。
表2 10个水稻基因双靶点CRISPR/Cas9载体构建引物
Figure BDA0002296809760000151
Figure BDA0002296809760000161
上表中,所述第一靶点引物片段正向引物的5’端序列为ggca或gttg,所述第一靶点引物片段反向引物的5’端序列为aaac;
所述第二靶点引物片段正向引物的5’端序列为gccg,所述第二靶点引物片段正向引物的3’端序列为gtttt,所述第二靶点引物片段反向引物的5’端序列为ctctaaaac。
步骤B3:外源片段的制备
步骤B3-1:包含所述外源片段的载体制备:
制备提供外源片段gRNA2-LacZ-PU6a的载体pGLU6a由以下步骤制得:
以引物gRNA-F和gRNA-R进行PCR,将gRNA2从pYLgRNA-OsU6a扩增出来;
以引物LacZ-F和LacZ-R进行PCR,将LacZ表达盒从pYL322d2(Zhu et al 2017)扩增出来;
以引物U6a-F和U6a-R进行PCR,将启动子PU6a从pYLgRNA-OsU6a扩增出来;
通过重叠延伸PCR将gRNA2、LacZ表达盒和PU6a连接成为一个DNA片段,最后克隆到pEASY-Blunt3载体上,构建为提供外源片段gRNA2-LacZ-PU6a的载体pGLU6a。
步骤B3-2
提取外源片段gRNA2-LacZ-PU6a
利用限制性内切酶Bsa I酶切pGLU6a,酶切体系如下:
Figure BDA0002296809760000171
按如上体系配好反应后,37℃酶切1h,跑1%-1.5%琼脂糖凝胶,利用DNA纯化回收试剂盒回收外源片段。NanoDrop2000测好浓度后,-20℃保存备用。
步骤B4:线性化载体
利用限制性内切酶Bsa I酶切pRC3/pRC6b,酶切体系如下:
Figure BDA0002296809760000172
按如上体系配好反应后,37℃酶切1h,65℃(Bsa I)/80℃(Bsa
Figure BDA0002296809760000173
v2)灭活20min,-20℃保存备用。
步骤B5:将所述步骤B2靶点引物变性退火,形成带粘性末端的双链靶点接头,再与所述线性化骨架载体及步骤B3外源片段进行连接,得到连接产物;
制备靶点接头。
靶点引物合成后,将靶点引物用ddH2O溶解成100μmol/L母液,各取1μl加入到98μlddH2O混合稀释到1μmol/L。90℃,变性30sec,移至室温冷却完成退火。
连接反应。
将0.2或0.5μl靶点引物(浓度为1μmol/L),15或30ng外源片段gRNA2-LacZ-PU6a和80或160ng Bsa I线性化载体pRC3或pRC6b,利用NEB T4 DNA ligase连接,20μl反应体系(2μl 10×NEB T4 DNA ligase buffer,80U T4 DNA ligase),利用PCR仪10℃5min,20℃5min,反应10~15个循环。
所述第一靶点引物片段正向引物的5’端序列为ggca时靶点引物与pRC3骨架载体构成连接反应的体系,构建至所述pRC3骨架载体上;所述第一靶点引物片段正向引物的5’端序列为gttg与pRC6b骨架载体构成连接反应的体系,构建至所述pRC6b骨架载体上。
步骤B6
连接产物转化大肠杆菌Trans1-T1。
取30μL冰浴上融化的大肠杆菌感受态细胞(Trans1-T1 Phage ResistantChemically Competent Cell)加到1.5mL无菌离心管中,然后加入5μL连接产物,轻轻混匀,在冰浴中放置30min。
42℃水浴热激30sec,然后快速转移到冰上放置2min,该过程不要摇动离心管。
向每个离心管中加入600μL LB液体培养基(不含抗生素),混匀后置于37℃,180r/min培养1h,使大肠杆菌复苏。
6000r/min离心30sec,弃去400μL上清,用剩余的200μL培养基悬浮菌体,将菌液全部转移到含有卡那霉素,IPTG和X-gal的LB培养皿上,涂开并晾干,做好标记,倒置于37℃恒温培养箱,过夜培养。
摇菌培养。
在灭菌过的10mL离心管中加入2mL卡那霉素抗性的LB液体培养基,每个皿上挑取3个蓝色单菌落至培养基中,置于摇床中,37℃,180r/min培养12-16h。
质粒酶切检测。
用碱裂解法抽提质粒,然后以空载体pRC3/pRC6b为对照,限制性内切酶Mlu I和BamH I酶切质粒检测,酶切体系如下:
Figure BDA0002296809760000191
37℃酶切30min,跑1%-1.5%琼脂糖凝胶检测。
在构建双靶点双靶点CRISPR/Cas9载体时,根据靶点引物序列构建对应的骨架载体即可,同理,实施例二根据表2中第一靶点引物片段序列分开设计的骨架载体。
酶切结果如图5,均切出正确大小的外源片段,阳性率为100%,测序显示无突变。这说明该方法适用于水稻基因的双靶点CRISPR/Cas9载体构建。
与传统方法相比,采用本方法构建单/双靶点CRISPR/Cas9载体非常简单、快速和高效。
本方法非常简单,首先,利用软件CRISPR-P2.0(Liu et al 2017)来选择合适的靶点,加好接头之后合成引物,然后将合成的靶点引物90℃变性30sec,移至室温冷却完成退火,完成靶点的制备,再与外源片段gRNA2-LacZ-PU6a在T4 DNA连接酶作用下,构建到线性化的载体pRC3或pRC6b上完成连接。最后转化大肠杆菌,涂布含有IPTG和X-gal的筛选培养基,挑选蓝色单菌落送测序验证,即完成双靶点CRISPR/Cas9载体构建。其中利用BsaⅠ线性化的载体和酶切回收的外源片段gRNA2-LacZ-PU6a可以长期存放于-20℃,不用每次制备,非常方便用于大量CRISPR/Cas9载体构建。
本载体系统非常快速。从获得靶点引物开始,只需要1h至2h即可获得连接产物。连接产物转化感受态细胞后,第2天即可获得阳性的CRISPR/Cas9载体。而用传统方法构建CRISPR/Cas9时,需要复杂且漫长的人工操作,需要约8h才能获得连接产物。或者需要经过2次转化感受态细胞约4d至7d才能获得阳性克隆。
此外,本载体系统构建CRISPR/Cas9载体不需要经过PCR过程,大大降低了外源片段的突变概率。选取了10个已报道的水稻基因,利用本载体系统构建了20个双靶点CRISPR/Cas9载体,挑取蓝色克隆酶切验证并测序发现,阳性克隆概率为100%
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 华中农业大学
<120> 一种简单快速高效的CRISPR/Cas9载体构建方法
<160> 11
<170> SIPOSequenceListing 1.0
<210> 1
<211> 16668
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attaattcgg gggatctgga ttttagtact 120
ggattttggt tttaggaatt agaaatttta ttgatagaag tattttacaa atacaaatac 180
atactaaggg tttcttatat gctcaacaca tgagcgaaac cctataggaa ccctaattcc 240
cttatctggg aactactcac acattattat ggagaaactc gagcttgtcg atcgacagat 300
ccggtcggca tctactctat ttctttgccc tcggacgagt gctggggcgt cggtttccac 360
tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg cgggcgattt 420
gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga ccctgcgccc 480
aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca agaccaatgc 540
ggagcatata cgcccggagt cgtggcgatc ctgcaagctc cggatgcctc cgctcgaagt 600
agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg ttggcgacct 660
cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt atgcggccat 720
tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc 780
agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca ctgacggtgt 840
cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat atgaaatcac 900
gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg ctcgtctggc 960
taagatcggc cgcagcgatc gcatccatag cctccgcgac cggttgtaga acagcgggca 1020
gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag atgcaatagg 1080
tcaggctctc gctaaactcc ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg 1140
caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta tttacccgca 1200
ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg ccctccgaga 1260
gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg acagacgtcg 1320
cggtgagttc aggctttttc atatctcatt gccccccggg atctgcgaaa gctcgagaga 1380
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 1440
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 1500
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 1560
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 1620
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 1680
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 1740
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 1800
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 1860
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 1920
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 1980
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 2040
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 2100
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 2160
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2220
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2280
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2340
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2400
cgaattcgag ctcggtacca actataacgg tcctaaggta gcgaaggatc cgctcgctac 2460
cttaagagag gatatccctc catcctataa tgtaggctat aggaactagg gcaaggccgg 2520
ccatgcggcc gcaagctggg tgcagcgtga cccggtcgtg cccctctcta gagataatga 2580
gcattgcatg tctaagttat aaaaaattac cacatatttt ttttgtcaca cttgtttgaa 2640
gtgcagttta tctatcttta tacatatatt taaactttac tctacgaata atataatcta 2700
tagtactaca ataatatcag tgttttagag aatcatataa atgaacagtt agacatggtc 2760
taaaggacaa ttgagtattt tgacaacagg actctacagt tttatctttt tagtgtgcat 2820
gtgttctcct ttttttttgc aaatagcttc acctatataa tacttcatcc attttattag 2880
tacatccatt tagggtttag ggttaatggt ttttatagac taattttttt agtacatcta 2940
ttttattcta ttttagcctc taaattaaga aaactaaaac tctattttag tttttttatt 3000
taataattta gatataaaat agaataaaat aaagtgacta aaaattaaac aaataccctt 3060
taagaaatta aaaaaactaa ggaaacattt ttcttgtttc gagtagataa tgccagcctg 3120
ttaaacgccg tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 3180
ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 3240
cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 3300
acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcacggcag ctacggggga 3360
ttcctttccc accgctcctt cgctttccct tcctcgcccg ccgtaataaa tagacacccc 3420
ctccacaccc tctttcccca acctcgtgtt gttcggagcg cacacacaca caaccagatc 3480
tcccccaaat ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc 3540
ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc ggtagttcta 3600
cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt 3660
acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag tgtttctctt 3720
tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca tgattttttt 3780
tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat gccgtgcact 3840
tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat gtggtctggt 3900
tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg gatttattaa 3960
ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag atgatggatg 4020
gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg catatacaga 4080
gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 4140
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 4200
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 4260
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 4320
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 4380
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 4440
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 4500
cctgttgttt ggtgttactt ctgcagatgg ctcctaagaa gaagcggaag gttggtattc 4560
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 4620
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 4680
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 4740
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 4800
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 4860
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 4920
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 4980
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 5040
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 5100
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 5160
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 5220
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 5280
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 5340
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 5400
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 5460
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 5520
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 5580
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 5640
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 5700
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 5760
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 5820
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 5880
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 5940
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 6000
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 6060
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 6120
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 6180
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 6240
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 6300
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggt acctaccacg 6360
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 6420
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 6480
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 6540
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 6600
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 6660
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 6720
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 6780
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 6840
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 6900
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 6960
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 7020
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 7080
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 7140
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 7200
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 7260
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 7320
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 7380
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 7440
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 7500
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggtaccg 7560
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 7620
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 7680
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 7740
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 7800
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 7860
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 7920
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 7980
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 8040
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 8100
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 8160
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 8220
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 8280
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 8340
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 8400
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 8460
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 8520
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 8580
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 8640
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 8700
aggccggaca ggctaagaaa aagaagtagg atcctcccga tcgttcaaac atttggcaat 8760
aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt 8820
tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt atgaggtggg 8880
tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc 8940
gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggagcacc 9000
ggtaaggcgc gccgtagtgc tcgactagta ggaatcttta aacatacgaa cagatcactt 9060
aaagttcttc tgaagcaact taaagttatc aggcatgcat ggatcttgga ggaatcagat 9120
gtgcagtcag ggaccatagc acaagacagg cgtcttctac tggtgctacc agcaaatgct 9180
ggaagccggg aacactgggt acgttggaaa ccacgtgtga tgtgaaggag taagataaac 9240
tgtaggagaa aagcatttcg tagtgggcca tgaagccttt caggacatgt attgcagtat 9300
gggccggccc attacgcaat tggacgacaa caaagactag tattagtacc acctcggcta 9360
tccacataga tcaaagctgg tttaaaagag ttgtgcagat gatccgtggc aagagaccgc 9420
tttacacttt atgcttccgg ctcgtataat gtgtggattt tgagttagga tccgtcgaga 9480
ttttcaggag ctaaggaagc taaaatgcag tttaaggttt acacctataa aagagagagc 9540
cgttatcgtc tgtttgtgga tgtacagagt gatattattg acacgcccgg gcgacggatg 9600
gtgatccccc tggccagtgc acgtctgctg tcagataaag tctcccgtga actttacccg 9660
gtggtgcata tcggggatga aagctggcgc atgatgacca ccgatatggc cagtgtgcct 9720
gtctccgtta tcggggaaga agtggctgat ctcagccacc gcgaaaatga catcaaaaac 9780
gccattaacc tgatgttctg gggaatataa atgtcaggct cccttataca cagccagtct 9840
gcaggtggtc tcgagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 9900
gaaaaagtgg caccgagtcg gtgctttttt tcaagagctt ggagtggatg gacgcgtcgg 9960
tatcattggc gcgcctctcg agctagcggc cgcatgcatc gatctcctac atcgtataaa 10020
ttagcctata cgaagttatt gcatctatgt cgggtgcgga gaaagaggta atgaaatggc 10080
agtattagat ctgataactt cgtataatgt atgctatacg aagttatgac tgcaggtcga 10140
cacccataat agctgtttgc caagcttggc actggccgtc gtttttacaa cgtcgtgact 10200
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 10260
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 10320
gcgaatgcta gagcagcttg agcttggatc agattgtcgt ttcccgcctt cagtttaaac 10380
tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 10440
ataacggata tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg 10500
ccaaccacag ggttcccctc gggatcaaag tactttgatc caacccctcc gctgctatag 10560
tgcagtcggc ttctgacgtt cagtgcagcc gtcttctgaa aacgacatgt cgcacaagtc 10620
ctaagttacg cgacaggctg ccgccctgcc cttttcctgg cgttttcttg tcgcgtgttt 10680
tagtcgcata aagtagaata cttgcgacta gaaccggaga cattacgcca tgaacaagag 10740
cgccgccgct ggcctgctgg gctatgcccg cgtcagcacc gacgaccagg acttgaccaa 10800
ccaacgggcc gaactgcacg cggccggctg caccaagctg ttttccgaga agatcaccgg 10860
caccaggcgc gaccgcccgg agctggccag gatgcttgac cacctacgcc ctggcgacgt 10920
tgtgacagtg accaggctag accgcctggc ccgcagcacc cgcgacctac tggacattgc 10980
cgagcgcatc caggaggccg gcgcgggcct gcgtagcctg gcagagccgt gggccgacac 11040
caccacgccg gccggccgca tggtgttgac cgtgttcgcc ggcattgccg agttcgagcg 11100
ttccctaatc atcgaccgca cccggagcgg gcgcgaggcc gccaaggccc gaggcgtgaa 11160
gtttggcccc cgccctaccc tcaccccggc acagatcgcg cacgcccgcg agctgatcga 11220
ccaggaaggc cgcaccgtga aagaggcggc tgcactgctt ggcgtgcatc gctcgaccct 11280
gtaccgcgca cttgagcgca gcgaggaagt gacgcccacc gaggccaggc ggcgcggtgc 11340
cttccgtgag gacgcattga ccgaggccga cgccctggcg gccgccgaga atgaacgcca 11400
agaggaacaa gcatgaaacc gcaccaggac ggccaggacg aaccgttttt cattaccgaa 11460
gagatcgagg cggagatgat cgcggccggg tacgtgttcg agccgcccgc gcacgtctca 11520
accgtgcggc tgcatgaaat cctggccggt ttgtctgatg ccaagctggc ggcctggccg 11580
gccagcttgg ccgctgaaga aaccgagcgc cgccgtctaa aaaggtgatg tgtatttgag 11640
taaaacagct tgcgtcatgc ggtcgctgcg tatatgatgc gatgagtaaa taaacaaata 11700
cgcaagggga acgcatgaag gttatcgctg tacttaacca gaaaggcggg tcaggcaaga 11760
cgaccatcgc aacccatcta gcccgcgccc tgcaactcgc cggggccgat gttctgttag 11820
tcgattccga tccccagggc agtgcccgcg attgggcggc cgtgcgggaa gatcaaccgc 11880
taaccgttgt cggcatcgac cgcccgacga ttgaccgcga cgtgaaggcc atcggccggc 11940
gcgacttcgt agtgatcgac ggagcgcccc aggcggcgga cttggctgtg tccgcgatca 12000
aggcagccga cttcgtgctg attccggtgc agccaagccc ttacgacata tgggccaccg 12060
ccgacctggt ggagctggtt aagcagcgca ttgaggtcac ggatggaagg ctacaagcgg 12120
cctttgtcgt gtcgcgggcg atcaaaggca cgcgcatcgg cggtgaggtt gccgaggcgc 12180
tggccgggta cgagctgccc attcttgagt cccgtatcac gcagcgcgtg agctacccag 12240
gcactgccgc cgccggcaca accgttcttg aatcagaacc cgagggcgac gctgcccgcg 12300
aggtccaggc gctggccgct gaaattaaat caaaactcat ttgagttaat gaggtaaaga 12360
gaaaatgagc aaaagcacaa acacgctaag tgccggccgt ccgagcgcac gcagcagcaa 12420
ggctgcaacg ttggccagcc tggcagacac gccagccatg aagcgggtca actttcagtt 12480
gccggcggag gatcacacca agctgaagat gtacgcggta cgccaaggca agaccattac 12540
cgagctgcta tctgaataca tcgcgcagct accagagtaa atgagcaaat gaataaatga 12600
gtagatgaat tttagcggct aaaggaggcg gcatggaaaa tcaagaacaa ccaggcaccg 12660
acgccgtgga atgccccatg tgtggaggaa cgggcggttg gccaggcgta agcggctggg 12720
ttgtctgccg gccctgcaat ggcactggaa cccccaagcc cgaggaatcg gcgtgacggt 12780
cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg gtgatgacct ggtggagaag 12840
ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg cagaagcacg ccccggtgaa 12900
tcgtggcaag cggccgctga tcgaatccgc aaagaatccc ggcaaccgcc ggcagccggt 12960
gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac cagatttttt cgttccgatg 13020
ctctatgacg tgggcacccg cgatagtcgc agcatcatgg acgtggccgt tttccgtctg 13080
tcgaagcgtg accgacgagc tggcgaggtg atccgctacg agcttccaga cgggcacgta 13140
gaggtttccg cagggccggc cggcatggcc agtgtgtggg attacgacct ggtactgatg 13200
gcggtttccc atctaaccga atccatgaac cgataccggg aagggaaggg agacaagccc 13260
ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt tctgccggcg agccgatggc 13320
ggaaagcaga aagacgacct ggtagaaacc tgcattcggt taaacaccac gcacgttgcc 13380
atgcagcgta cgaagaaggc caagaacggc cgcctggtga cggtatccga gggtgaagcc 13440
ttgattagcc gctacaagat cgtaaagagc gaaaccgggc ggccggagta catcgagatc 13500
gagctagctg attggatgta ccgcgagatc acagaaggca agaacccgga cgtgctgacg 13560
gttcaccccg attacttttt gatcgatccc ggcatcggcc gttttctcta ccgcctggca 13620
cgccgcgccg caggcaaggc agaagccaga tggttgttca agacgatcta cgaacgcagt 13680
ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc gcaagctgat cgggtcaaat 13740
gacctgccgg agtacgattt gaaggaggag gcggggcagg ctggcccgat cctagtcatg 13800
cgctaccgca acctgatcga gggcgaagca tccgccggtt cctaatgtac ggagcagatg 13860
ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag gtctgtttcc tgtggatagc 13920
acgtacattg ggaacccaaa gccgtacatt gggaaccgga acccgtacat tgggaaccca 13980
aagccgtaca ttgggaaccg gtcacacatg taagtgactg atataaaaga gaaaaaaggc 14040
gatttttccg cctaaaactc tttaaaactt attaaaactc ttaaaacccg cctggcctgt 14100
gcataactgt ctggccagcg cacagccgaa gagctgcaaa aagcgcctac ccttcggtcg 14160
ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg cggccgctgg ccgctcaaaa 14220
atggctggcc tacggccagg caatctacca gggcgcggac aagccgcgcc gtcgccactc 14280
gaccgccggc gcccacatca aggcaccctg cctcgcgcgt ttcggtgatg acggtgaaaa 14340
cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 14400
cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac 14460
ccagtcacgt agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt 14520
gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac 14580
cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 14640
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 14700
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 14760
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 14820
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 14880
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 14940
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 15000
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 15060
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 15120
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 15180
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 15240
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 15300
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 15360
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 15420
taagggattt tggtcatgca ttctaggtac taaaacaatt catccagtaa aatataatat 15480
tttattttct cccaatcagg cttgatcccc agtaagtcaa aaaatagctc gacatactgt 15540
tcttccccga tatcctccct gatcgaccgg acgcagaagg caatgtcata ccacttgtcc 15600
gccctgccgc ttctcccaag atcaataaag ccacttactt tgccatcttt cacaaagatg 15660
ttgctgtctc ccaggtcgcc gtgggaaaag acaagttcct cttcgggctt ttccgtcttt 15720
aaaaaatcat acagctcgcg cggatcttta aatggagtgt cttcttccca gttttcgcaa 15780
tccacatcgg ccagatcgtt attcagtaag taatccaatt cggctaagcg gctgtctaag 15840
ctattcgtat agggacaatc cgatatgtcg atggagtgaa agagcctgat gcactccgca 15900
tacagctcga taatcttttc agggctttgt tcatcttcat actcttccga gcaaaggacg 15960
ccatcggcct cactcatgag cagattgctc cagccatcat gccgttcaaa gtgcaggacc 16020
tttggaacag gcagctttcc ttccagccat agcatcatgt ccttttcccg ttccacatca 16080
taggtggtcc ctttataccg gctgtccgtc atttttaaat ataggttttc attttctccc 16140
accagcttat ataccttagc aggagacatt ccttccgtat cttttacgca gcggtatttt 16200
tcgatcagtt ttttcaattc cggtgatatt ctcattttag ccatttatta tttccttcct 16260
cttttctaca gtatttaaag ataccccaag aagctaatta taacaagacg aactccaatt 16320
cactgttcct tgcattctaa aaccttaaat accagaaaac agctttttca aagttgtttt 16380
caaagttggc gtataacata gtatcgacgg agccgatttt gaaaccgcgg tgatcacagg 16440
cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc atccgtgttt 16500
caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga gcaaagtctg 16560
ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc ctgtatcgag 16620
tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctgg 16668
<210> 2
<211> 16637
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attaattcgg gggatctgga ttttagtact 120
ggattttggt tttaggaatt agaaatttta ttgatagaag tattttacaa atacaaatac 180
atactaaggg tttcttatat gctcaacaca tgagcgaaac cctataggaa ccctaattcc 240
cttatctggg aactactcac acattattat ggagaaactc gagcttgtcg atcgacagat 300
ccggtcggca tctactctat ttctttgccc tcggacgagt gctggggcgt cggtttccac 360
tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg cgggcgattt 420
gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga ccctgcgccc 480
aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca agaccaatgc 540
ggagcatata cgcccggagt cgtggcgatc ctgcaagctc cggatgcctc cgctcgaagt 600
agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg ttggcgacct 660
cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt atgcggccat 720
tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc 780
agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca ctgacggtgt 840
cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat atgaaatcac 900
gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg ctcgtctggc 960
taagatcggc cgcagcgatc gcatccatag cctccgcgac cggttgtaga acagcgggca 1020
gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag atgcaatagg 1080
tcaggctctc gctaaactcc ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg 1140
caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta tttacccgca 1200
ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg ccctccgaga 1260
gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg acagacgtcg 1320
cggtgagttc aggctttttc atatctcatt gccccccggg atctgcgaaa gctcgagaga 1380
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 1440
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 1500
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 1560
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 1620
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 1680
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 1740
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 1800
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 1860
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 1920
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 1980
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 2040
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 2100
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 2160
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2220
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2280
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2340
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2400
cgaattcgag ctcggtacca actataacgg tcctaaggta gcgaaggatc cgctcgctac 2460
cttaagagag gatatccctc catcctataa tgtaggctat aggaactagg gcaaggccgg 2520
ccatgcggcc gcaagctggg tgcagcgtga cccggtcgtg cccctctcta gagataatga 2580
gcattgcatg tctaagttat aaaaaattac cacatatttt ttttgtcaca cttgtttgaa 2640
gtgcagttta tctatcttta tacatatatt taaactttac tctacgaata atataatcta 2700
tagtactaca ataatatcag tgttttagag aatcatataa atgaacagtt agacatggtc 2760
taaaggacaa ttgagtattt tgacaacagg actctacagt tttatctttt tagtgtgcat 2820
gtgttctcct ttttttttgc aaatagcttc acctatataa tacttcatcc attttattag 2880
tacatccatt tagggtttag ggttaatggt ttttatagac taattttttt agtacatcta 2940
ttttattcta ttttagcctc taaattaaga aaactaaaac tctattttag tttttttatt 3000
taataattta gatataaaat agaataaaat aaagtgacta aaaattaaac aaataccctt 3060
taagaaatta aaaaaactaa ggaaacattt ttcttgtttc gagtagataa tgccagcctg 3120
ttaaacgccg tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 3180
ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 3240
cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 3300
acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcacggcag ctacggggga 3360
ttcctttccc accgctcctt cgctttccct tcctcgcccg ccgtaataaa tagacacccc 3420
ctccacaccc tctttcccca acctcgtgtt gttcggagcg cacacacaca caaccagatc 3480
tcccccaaat ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc 3540
ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc ggtagttcta 3600
cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt 3660
acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag tgtttctctt 3720
tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca tgattttttt 3780
tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat gccgtgcact 3840
tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat gtggtctggt 3900
tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg gatttattaa 3960
ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag atgatggatg 4020
gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg catatacaga 4080
gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 4140
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 4200
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 4260
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 4320
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 4380
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 4440
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 4500
cctgttgttt ggtgttactt ctgcagatgg ctcctaagaa gaagcggaag gttggtattc 4560
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 4620
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 4680
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 4740
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 4800
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 4860
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 4920
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 4980
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 5040
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 5100
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 5160
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 5220
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 5280
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 5340
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 5400
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 5460
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 5520
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 5580
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 5640
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 5700
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 5760
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 5820
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 5880
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 5940
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 6000
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 6060
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 6120
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 6180
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 6240
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 6300
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggt acctaccacg 6360
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 6420
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 6480
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 6540
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 6600
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 6660
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 6720
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 6780
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 6840
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 6900
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 6960
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 7020
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 7080
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 7140
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 7200
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 7260
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 7320
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 7380
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 7440
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 7500
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggtaccg 7560
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 7620
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 7680
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 7740
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 7800
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 7860
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 7920
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 7980
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 8040
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 8100
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 8160
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 8220
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 8280
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 8340
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 8400
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 8460
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 8520
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 8580
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 8640
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 8700
aggccggaca ggctaagaaa aagaagtagg atcctcccga tcgttcaaac atttggcaat 8760
aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt 8820
tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt atgaggtggg 8880
tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc 8940
gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggagcacc 9000
ggtaaggcgc gccgtagtgc tcgactagtg gaatcggcag caaaggatgc aagaacgaac 9060
taagccggac aaaaaaaaaa ggagcacata tacaaaccgg ttttattcat gaatggtcac 9120
gatggatgat ggggctcaga cttgagctac gaggccgcag gcgagagaag cctagtgtgc 9180
tctctgcttg tttgggccgt aacggaggat acggccgacg agcgtgtact accgcgcggg 9240
atgccgctgg gcgctgcggg ggccgttgga tggggatcgg tgggtcgcgg gagcgttgag 9300
gggagacagg tttagtacca cctcgcctac cgaacaatga agaacccacc ttataacccc 9360
gcgcgctgcc gcttgtgttg agagaccgct ttacacttta tgcttccggc tcgtataatg 9420
tgtggatttt gagttaggat ccgtcgagat tttcaggagc taaggaagct aaaatgcagt 9480
ttaaggttta cacctataaa agagagagcc gttatcgtct gtttgtggat gtacagagtg 9540
atattattga cacgcccggg cgacggatgg tgatccccct ggccagtgca cgtctgctgt 9600
cagataaagt ctcccgtgaa ctttacccgg tggtgcatat cggggatgaa agctggcgca 9660
tgatgaccac cgatatggcc agtgtgcctg tctccgttat cggggaagaa gtggctgatc 9720
tcagccaccg cgaaaatgac atcaaaaacg ccattaacct gatgttctgg ggaatataaa 9780
tgtcaggctc ccttatacac agccagtctg caggtggtct cgagagctag aaatagcaag 9840
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt 9900
caagagcttg gagtggatgg acgcgtcggt atcattggcg cgcctctcga gctagcggcc 9960
gcatgcatcg atctcctaca tcgtataaat tagcctatac gaagttattg catctatgtc 10020
gggtgcggag aaagaggtaa tgaaatggca gtattagatc tgataacttc gtataatgta 10080
tgctatacga agttatgact gcaggtcgac acccataata gctgtttgcc aagcttggca 10140
ctggccgtcg tttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 10200
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 10260
cccttcccaa cagttgcgca gcctgaatgg cgaatgctag agcagcttga gcttggatca 10320
gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 10380
aaacctaaga gaaaagagcg tttattagaa taacggatat ttaaaagggc gtgaaaaggt 10440
ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttcccctcg ggatcaaagt 10500
actttgatcc aacccctccg ctgctatagt gcagtcggct tctgacgttc agtgcagccg 10560
tcttctgaaa acgacatgtc gcacaagtcc taagttacgc gacaggctgc cgccctgccc 10620
ttttcctggc gttttcttgt cgcgtgtttt agtcgcataa agtagaatac ttgcgactag 10680
aaccggagac attacgccat gaacaagagc gccgccgctg gcctgctggg ctatgcccgc 10740
gtcagcaccg acgaccagga cttgaccaac caacgggccg aactgcacgc ggccggctgc 10800
accaagctgt tttccgagaa gatcaccggc accaggcgcg accgcccgga gctggccagg 10860
atgcttgacc acctacgccc tggcgacgtt gtgacagtga ccaggctaga ccgcctggcc 10920
cgcagcaccc gcgacctact ggacattgcc gagcgcatcc aggaggccgg cgcgggcctg 10980
cgtagcctgg cagagccgtg ggccgacacc accacgccgg ccggccgcat ggtgttgacc 11040
gtgttcgccg gcattgccga gttcgagcgt tccctaatca tcgaccgcac ccggagcggg 11100
cgcgaggccg ccaaggcccg aggcgtgaag tttggccccc gccctaccct caccccggca 11160
cagatcgcgc acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa agaggcggct 11220
gcactgcttg gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag cgaggaagtg 11280
acgcccaccg aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac cgaggccgac 11340
gccctggcgg ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg caccaggacg 11400
gccaggacga accgtttttc attaccgaag agatcgaggc ggagatgatc gcggccgggt 11460
acgtgttcga gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc ctggccggtt 11520
tgtctgatgc caagctggcg gcctggccgg ccagcttggc cgctgaagaa accgagcgcc 11580
gccgtctaaa aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg gtcgctgcgt 11640
atatgatgcg atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg ttatcgctgt 11700
acttaaccag aaaggcgggt caggcaagac gaccatcgca acccatctag cccgcgccct 11760
gcaactcgcc ggggccgatg ttctgttagt cgattccgat ccccagggca gtgcccgcga 11820
ttgggcggcc gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc gcccgacgat 11880
tgaccgcgac gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg gagcgcccca 11940
ggcggcggac ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga ttccggtgca 12000
gccaagccct tacgacatat gggccaccgc cgacctggtg gagctggtta agcagcgcat 12060
tgaggtcacg gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga tcaaaggcac 12120
gcgcatcggc ggtgaggttg ccgaggcgct ggccgggtac gagctgccca ttcttgagtc 12180
ccgtatcacg cagcgcgtga gctacccagg cactgccgcc gccggcacaa ccgttcttga 12240
atcagaaccc gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg aaattaaatc 12300
aaaactcatt tgagttaatg aggtaaagag aaaatgagca aaagcacaaa cacgctaagt 12360
gccggccgtc cgagcgcacg cagcagcaag gctgcaacgt tggccagcct ggcagacacg 12420
ccagccatga agcgggtcaa ctttcagttg ccggcggagg atcacaccaa gctgaagatg 12480
tacgcggtac gccaaggcaa gaccattacc gagctgctat ctgaatacat cgcgcagcta 12540
ccagagtaaa tgagcaaatg aataaatgag tagatgaatt ttagcggcta aaggaggcgg 12600
catggaaaat caagaacaac caggcaccga cgccgtggaa tgccccatgt gtggaggaac 12660
gggcggttgg ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg gcactggaac 12720
ccccaagccc gaggaatcgg cgtgacggtc gcaaaccatc cggcccggta caaatcggcg 12780
cggcgctggg tgatgacctg gtggagaagt tgaaggccgc gcaggccgcc cagcggcaac 12840
gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc ggccgctgat cgaatccgca 12900
aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat taggaagccg cccaagggcg 12960
acgagcaacc agattttttc gttccgatgc tctatgacgt gggcacccgc gatagtcgca 13020
gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga ccgacgagct ggcgaggtga 13080
tccgctacga gcttccagac gggcacgtag aggtttccgc agggccggcc ggcatggcca 13140
gtgtgtggga ttacgacctg gtactgatgg cggtttccca tctaaccgaa tccatgaacc 13200
gataccggga agggaaggga gacaagcccg gccgcgtgtt ccgtccacac gttgcggacg 13260
tactcaagtt ctgccggcga gccgatggcg gaaagcagaa agacgacctg gtagaaacct 13320
gcattcggtt aaacaccacg cacgttgcca tgcagcgtac gaagaaggcc aagaacggcc 13380
gcctggtgac ggtatccgag ggtgaagcct tgattagccg ctacaagatc gtaaagagcg 13440
aaaccgggcg gccggagtac atcgagatcg agctagctga ttggatgtac cgcgagatca 13500
cagaaggcaa gaacccggac gtgctgacgg ttcaccccga ttactttttg atcgatcccg 13560
gcatcggccg ttttctctac cgcctggcac gccgcgccgc aggcaaggca gaagccagat 13620
ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg agagttcaag aagttctgtt 13680
tcaccgtgcg caagctgatc gggtcaaatg acctgccgga gtacgatttg aaggaggagg 13740
cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa cctgatcgag ggcgaagcat 13800
ccgccggttc ctaatgtacg gagcagatgc tagggcaaat tgccctagca ggggaaaaag 13860
gtcgaaaagg tctgtttcct gtggatagca cgtacattgg gaacccaaag ccgtacattg 13920
ggaaccggaa cccgtacatt gggaacccaa agccgtacat tgggaaccgg tcacacatgt 13980
aagtgactga tataaaagag aaaaaaggcg atttttccgc ctaaaactct ttaaaactta 14040
ttaaaactct taaaacccgc ctggcctgtg cataactgtc tggccagcgc acagccgaag 14100
agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct acgccccgcc gcttcgcgtc 14160
ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct acggccaggc aatctaccag 14220
ggcgcggaca agccgcgccg tcgccactcg accgccggcg cccacatcaa ggcaccctgc 14280
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 14340
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 14400
gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact 14460
ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 14520
taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca 14580
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 14640
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 14700
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 14760
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 14820
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 14880
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 14940
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 15000
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 15060
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 15120
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 15180
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 15240
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 15300
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 15360
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgcat tctaggtact 15420
aaaacaattc atccagtaaa atataatatt ttattttctc ccaatcaggc ttgatcccca 15480
gtaagtcaaa aaatagctcg acatactgtt cttccccgat atcctccctg atcgaccgga 15540
cgcagaaggc aatgtcatac cacttgtccg ccctgccgct tctcccaaga tcaataaagc 15600
cacttacttt gccatctttc acaaagatgt tgctgtctcc caggtcgccg tgggaaaaga 15660
caagttcctc ttcgggcttt tccgtcttta aaaaatcata cagctcgcgc ggatctttaa 15720
atggagtgtc ttcttcccag ttttcgcaat ccacatcggc cagatcgtta ttcagtaagt 15780
aatccaattc ggctaagcgg ctgtctaagc tattcgtata gggacaatcc gatatgtcga 15840
tggagtgaaa gagcctgatg cactccgcat acagctcgat aatcttttca gggctttgtt 15900
catcttcata ctcttccgag caaaggacgc catcggcctc actcatgagc agattgctcc 15960
agccatcatg ccgttcaaag tgcaggacct ttggaacagg cagctttcct tccagccata 16020
gcatcatgtc cttttcccgt tccacatcat aggtggtccc tttataccgg ctgtccgtca 16080
tttttaaata taggttttca ttttctccca ccagcttata taccttagca ggagacattc 16140
cttccgtatc ttttacgcag cggtattttt cgatcagttt tttcaattcc ggtgatattc 16200
tcattttagc catttattat ttccttcctc ttttctacag tatttaaaga taccccaaga 16260
agctaattat aacaagacga actccaattc actgttcctt gcattctaaa accttaaata 16320
ccagaaaaca gctttttcaa agttgttttc aaagttggcg tataacatag tatcgacgga 16380
gccgattttg aaaccgcggt gatcacaggc agcaacgctc tgtcatcgtt acaatcaaca 16440
tgctaccctc cgcgagatca tccgtgtttc aaacccggca gcttagttgc cgttcttccg 16500
aatagcatcg gtaacatgag caaagtctgc cgccttacaa cggctctccc gctgacgccg 16560
tcccggactg atgggctgcc tgtatcgagt ggtgattttg tgccgagctg ccggtcgggg 16620
agctgttggc tggctgg 16637
<210> 3
<211> 3956
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 360
gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc 420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 480
gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct tttgatttat 540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 600
acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt ttctccttac 660
gcatctgtgc ggtatttcac accgcatcag gtggcacttt tcggggaaat gtgcgcggaa 720
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 780
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg 840
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc 900
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg 960
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga 1020
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc 1080
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag 1140
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga 1200
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg 1260
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga 1320
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt 1380
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 1440
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 1500
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 1560
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 1620
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 1680
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta 1740
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 1800
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 1860
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1920
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1980
agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2040
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 2100
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 2160
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 2220
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 2280
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 2340
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 2400
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 2460
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 2520
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 2580
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc 2640
ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga 2700
aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg 2760
ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc 2820
acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac tatagaatac 2880
tcaagctatg catccaacgc gttgggagct ctcccatatg gtcgacctgc aggcggccgc 2940
gaattcacta gtgattggga tcgcccttgg tctcggtttt agagctagaa atagcaagtt 3000
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttttca 3060
agagcttgga gtggatggac cctgacaggc tttacacttt atgcttccgg ctcgtatgtt 3120
gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 3180
cagatatcat gtcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta 3240
cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg 3300
cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg gacgcgccct 3360
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagctaagat ctggaatcgg 3420
cagcaaagga ttttttcctg tagttttccc acaaccattt tttaccatcc gaatgatagg 3480
ataggaaaaa tatccaagtg aacagtattc ctataaaatt cccgtaaaaa gcctgcaatc 3540
cgaatgagcc ctgaagtctg aactagccgg tcacctgtac aggctatcga gatgccatac 3600
aagagacggt agtaggaact aggaagacga tggttgattc gtcaggcgaa atcgtcgtcc 3660
tgcagtcgca tctatgggcc tggacggaat aggggaaaaa gttggccgga taggagggaa 3720
aggcccaggt gcttacgtgc gaggtaggcc tgggctctca gcacttcgat tcgttggcac 3780
cggggtagga tgcaatagag agcaacgttt agtaccacct cgcttagcta gagcaaactg 3840
gactgcctta tatgcgcggg tgctggcttg gctgccgaga gaccaagggc gatccaatcg 3900
aattcccgcg gccgccatgg cggccgggag catgcgacgt cgggcccaat tcgccc 3956
<210> 4
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggcannnnnn nnnnnnnnnn nnn 23
<210> 5
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaacnnnnnn nnnnnnnnnn nnn 23
<210> 6
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gccgnnnnnn nnnnnnnnnn nnngtttt 28
<210> 7
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctctaaaacn nnnnnnnnnn nnnnnnnn 28
<210> 8
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gttgnnnnnn nnnnnnnnnn nnn 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aaacnnnnnn nnnnnnnnnn nnn 23
<210> 10
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tacacagcca gtctgcaggt ggtctcgaga gctagaaata gcaa 44
<210> 11
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gagaggcgcg ccaatgatac cgacgcgtcc atccactcca agctcttg 48

Claims (8)

1.一种CRISPR/Cas9载体构建方法,其特征在于,所述CRISPR/Cas9载体构建方法包括:
构建骨架载体并对骨架载体进行线性化处理得到线性化的骨架载体,制备靶点引物后将所述靶点引物接入所述线性化的骨架载体中得到连接产物,将所述连接产物转接至大肠杆菌后依次进行培养、抽提质粒,得到阳性CRISPR/Cas9载体;
其中,所述骨架载体连接有OsU3启动子或OsU6b启动子、gRNA1及Bsa I酶切位点,所述gRNA1从pYLgRNA-OsU3上扩增后得到5’端碱基5’-gtttt-3被删除的gRNA1;
所述靶点引物包含多个引物片段,第一个靶点引物片段序列的正向靶点引物的5’端序列为ggca或gttg,最后一个靶点引物片段序列的正向引物3’端序列为gtttt,最后一个靶点引物片段序列的反向靶点引物的5’端序列为ctctaaaac,各个所述靶点引物片段之间通过制备的外源片段进行连接;所述外源片段包括gRNA2粘性末端及PU6a粘性末端,所述gRNA2粘性末端位于所述外源片段5’端,所述gRNA2粘性末端的序列为GTTT,所述PU6a粘性末端位于所述外源片段的3’端,所述PU6a粘性末端序列为CGGC;
所述骨架载体采用Bsa I酶进行酶切得到所述线性化的骨架载体,所述线性化的骨架载体包括Pu粘性末端及gRNA1粘性末端,所述Pu粘性末端位于所述线性化骨架载体的3’端,其序列为ccgt或caac,所述gRNA1粘性末端位于所述线性化骨架载体的5’端,其序列为agag;第一个靶点引物片段与所述Pu粘性末端连接,最后一个靶点引物片段序列与所述gRNA1粘性末端连接;所述外源片段的制备包括:将gRNA2、LacZ表达盒以及启动子PU6a构建到克隆载体pEASY-Blunt3 上得到外源片段载体pGLU6a,其中,gRNA2、LacZ表达盒以及启动子PU6a依次连接;外源片段提取,将所述外源片段载体采用Bsa I酶进行酶切,凝胶电泳后回收得到外源片段。
2.根据权利要求1所述的CRISPR/Cas9载体构建方法,其特征在于,扩增gRNA1的正向引物序列如SEQ ID NO.10所示,所述反向引物序列如SEQ ID NO.11。
3.根据权利要求1所述的CRISPR/Cas9载体构建方法,其特征在于,所述骨架载体上连接有ccdB表达盒,所述Bsa I酶切位点在ccdB的两端。
4.根据权利要求3所述的CRISPR/Cas9载体构建方法,其特征在于,所述骨架载体连接有OsU3启动子、gRNA1、ccdB表达盒及Bsa I酶切位点时,得到的骨架载体为pRC3骨架载体;
所述骨架载体连接有OsU6b启动子、gRNA1、ccdB表达盒及Bsa I酶切位点时,得到的骨架载体为pRC6b骨架载体;
所述pRC3骨架载体序列如SEQ ID NO.1所示;
所述pRC6b骨架载体序列如SEQ ID NO.2所示。
5.根据权利要求4所述的CRISPR/Cas9载体构建方法,其特征在于,第一个靶点引物片段序列的正向靶点引物的5’端序列为ggca时,所述靶点引物构建至所述pRC3骨架载体上;第一个靶点引物片段序列的正向靶点引物的5’端序列为gttg时,所述靶点引物构建至所述pRC6b骨架载体上。
6.权利要求1~5任一项所述的CRISPR/Cas9载体构建方法在构建多靶点CRISPR/Cas9载体中的应用,其特征在于,包括以下步骤:
步骤B1:构建骨架载体;
步骤B2:制备靶点引物;
步骤B3:制备外源片段;
步骤B4:对所述骨架载体进行线性化处理,得到线性化的骨架载体;
步骤B5:将所述步骤B2靶点引物变性退火,形成带粘性末端的靶点接头,再与所述线性化的骨架载体及所述外源片段进行连接,得到连接产物;
步骤B6:将所述连接产物转接至大肠杆菌后依次进行培养、抽提质粒,酶切验证得到阳性CRISPR/Cas9载体;
其中,所述步骤B3包括如下步骤:
步骤B3-1:包含所述外源片段的载体制备:将和启动子PU6a以及LacZ表达盒构建到克隆载体pEASY-Blunt3上得到外源片段载体pGLU6a,所述pGLU6a的序列如SEQ ID NO.3所示;
步骤B3-2:外源片段提取,将所述外源片段载体采用Bsa I酶进行酶切,凝胶电泳后回收得到外源片段。
7.根据权利要求6所述的CRISPR/Cas9载体构建方法在构建多靶点CRISPR/Cas9载体中的应用,其特征在于,所述靶点引物包含两个靶点引物片段;
其中,所述第一靶点引物片段正向引物的5’端序列为ggca或gttg,所述第一靶点引物片段反向引物的5’端序列为aaac;所述第二靶点引物片段正向引物的5’端序列为gccg,所述第二靶点引物片段正向引物的3’端序列为gtttt,所述第二靶点引物片段反向引物的5’端序列为ctctaaaac。
8.权利要求1~5任一项所述一种CRISPR/Cas9载体构建方法在水稻基因的CRISPR/Cas9载体构建中的应用。
CN201911205309.3A 2019-11-29 2019-11-29 一种简单快速高效的CRISPR/Cas9载体构建方法及应用 Active CN110951770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911205309.3A CN110951770B (zh) 2019-11-29 2019-11-29 一种简单快速高效的CRISPR/Cas9载体构建方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911205309.3A CN110951770B (zh) 2019-11-29 2019-11-29 一种简单快速高效的CRISPR/Cas9载体构建方法及应用

Publications (2)

Publication Number Publication Date
CN110951770A CN110951770A (zh) 2020-04-03
CN110951770B true CN110951770B (zh) 2021-11-30

Family

ID=69979134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911205309.3A Active CN110951770B (zh) 2019-11-29 2019-11-29 一种简单快速高效的CRISPR/Cas9载体构建方法及应用

Country Status (1)

Country Link
CN (1) CN110951770B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112553243B (zh) * 2020-12-11 2022-07-22 中国农业科学院棉花研究所 CRISPR/xCas9基因编辑系统在棉花中的应用
CN116121270A (zh) * 2023-03-27 2023-05-16 南京农业大学三亚研究院 一种水稻器官发育和产量调控基因及其应用
CN116716336B (zh) * 2023-06-16 2024-01-30 广东省农业科学院农业生物基因研究中心 OsSKIPa基因及其编码蛋白在调控植物种子发育中的应用
CN118581145A (zh) * 2024-08-06 2024-09-03 广东省农业科学院农业生物基因研究中心 OsSKIPa基因在调控水稻内颖发育中的应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109468338A (zh) * 2018-12-07 2019-03-15 苏州上源生物科技有限公司 一种快速构建秀丽线虫基因编辑所需目的pU6-sgRNA质粒的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11274302B2 (en) * 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
CN109825532B (zh) * 2019-03-04 2019-12-10 中国科学院昆明植物研究所 CRISPR/Cas12a基因编辑系统在小立碗藓基因编辑中的应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109468338A (zh) * 2018-12-07 2019-03-15 苏州上源生物科技有限公司 一种快速构建秀丽线虫基因编辑所需目的pU6-sgRNA质粒的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Robust CRISPR/Cas9 System for Convenient, High-Efficiency Multiplex Genome Editing in Monocot and Dicot Plants;Ma X等;《Mol Plant》;20150424;第8卷(第8期);摘要,图1 *
Generation of deletions and precise point mutations in Dictyostelium discoideum using the CRISPR nickase;Iriki H等;《PLoS One》;20191017;第14卷(第10期);第4页第1段-第5页第1段,第7页第4段,图3A *

Also Published As

Publication number Publication date
CN110951770A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
CN110951770B (zh) 一种简单快速高效的CRISPR/Cas9载体构建方法及应用
AU2019208278B2 (en) Intein-modified proteases, their production and industrial applications
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
AU2018279457B2 (en) Method for manufacturing DNA-edited eukaryotic cell, and kit used in method
CN110951741B (zh) 一种基于CRISPR Cpf1的枯草芽孢杆菌多基因编辑和表达调控系统
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
CA2763792C (en) Expression cassettes derived from maize
CN101001951B (zh) 分离转录终止序列的方法
US20030159160A1 (en) Method for the stable inversion of DNA sequence by site-specific recombination and DNA vectors and transgenic cells thereof
AU2016364229A1 (en) Means and methods for preparing engineered proteins by genetic code expansion in insect cells
US20030157682A1 (en) Mismatch endonucleases and methods of use
CN112725282A (zh) 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN110004163B (zh) 多基因编辑提高水稻抗旱性的方法
CN115190912A (zh) Rna指导核酸酶及其活性片段与变体以及使用方法
CN110214188B (zh) 7-氨基头孢烷酸的高浓度生产重组顶头孢霉菌株的制造方法及利用其方法所制造的菌株
CN108456687B (zh) 基于赖氨酸浓度控制的重组表达质粒、转化子及其应用
CN111041038B (zh) 高效生物合成虾青素的集胞藻6803基因工程菌及构建方法及应用
CN109295100A (zh) 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
KR102416059B1 (ko) 에레모테시움의 발효를 통한 리보플라빈의 더 높은 생성을 위한 베타-산화 경로의 효소를 엔코딩하는 유전자 및 지방산 수송체 유전자의 과-발현
CN107502619B (zh) 一组干酪乳杆菌基因敲除载体及其应用
CN112011471A (zh) 酿制柠檬风味啤酒的酵母菌株、其制备方法及啤酒酿制方法
KR101495276B1 (ko) 광 유도성 프로모터 및 이를 포함하는 유전자 발현 시스템
CN114763556B (zh) 一种基因编辑效率提高的引导碱基编辑系统及其应用
CN111088201B (zh) 一株重组丙酮丁醇梭菌及其构建方法与应用
CN113073102B (zh) 自噬基因atg9在水稻育种和/或水稻粒型机制研究中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant