CN113717962A - 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体 - Google Patents

用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体 Download PDF

Info

Publication number
CN113717962A
CN113717962A CN202111062804.0A CN202111062804A CN113717962A CN 113717962 A CN113717962 A CN 113717962A CN 202111062804 A CN202111062804 A CN 202111062804A CN 113717962 A CN113717962 A CN 113717962A
Authority
CN
China
Prior art keywords
cas
protein
phi
crrna
expression cassette
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111062804.0A
Other languages
English (en)
Inventor
王高华
段芳
谢先荣
刘伟智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Aidijing Biotechnology Co ltd
Original Assignee
Wuhan Aidijing Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Aidijing Biotechnology Co ltd filed Critical Wuhan Aidijing Biotechnology Co ltd
Priority to CN202111062804.0A priority Critical patent/CN113717962A/zh
Publication of CN113717962A publication Critical patent/CN113717962A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种用于水稻基因编辑的CasΦ‑2蛋白及其表达盒子和表达载体,CasΦ‑2蛋白的N端增加1个核定位信号肽氨基酸序列,在C端增加3个核定位信号肽氨基酸序列。CasΦ‑2蛋白的CrRNA表达盒子包括基因编辑靶点、启动子和CasΦ‑2蛋白的CrRNA,CrRNA的核苷酸序列两端分别连接有1个tRNA序列;表达载体含有上述表达盒子和CasΦ‑2蛋白的核苷酸序列。上述表达载体能够有效实现水稻基因的敲除编辑。

Description

用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体
技术领域
本发明属于分子生物学技术领域领域,特别是用于水稻基因编辑的CasΦ-2 蛋白及其表达盒子和表达载体。
背景技术
CasΦ(Cas12j)是V型CRISPR-Cas蛋白进化而来,一个在噬菌体进化枝中编码的Cas蛋白家族,包含一个C端RuvC结构域,与TnpB核酸酶超家族的结构域具有远源同源性,CasΦ的单个RuvC活性位点能够进行crRNA加工和DNA 切割。然而,CasΦ与其他V型CRISPR-Cas蛋白<7%的氨基酸同源性,并且与不同于V型(Cas14)蛋白的TnpB组最密切相关。
CasΦ的分子量异常小,约为70到80kDa,大约是Cas9和Cas12a大小的一半。CasΦ的分子量小,以及PAM位点覆盖广泛的特点,该蛋白的PAM序列为“TTN”可以扩展其在真核生物基因组上的编辑范围,扩展了适用不同真核生物的基因编辑的可操作性和可选择性,对于基于载体的细胞递送和更广泛的可靶向基因组序列都特别有利,因此它将为CRISPR-Cas工具箱提供强大的补充。
CasΦ-2来源于噬菌体中的CasΦ直系同源物之一。其PAM位点也是富含T/A 区域“TTN”。CasΦ-2核酸酶的剪切方式和Cas12a的很相似,二者PAM位点都是富含T/A区域,像LbCpf1和AsCpf1的PAM位点都是识别“TTTN”,CasΦ-2 的PAM位点识别“TTN”和FnCpf1的类似;另外像LbCpf1的剪切位置在远离PAM 位点的19-24bp处剪切处4或5碱基的粘性末端,而CasΦ-2也是在远离PAM位点处剪切,剪切位置在12-18bp处;再者二者产生的突变类型都是以5bp以上的多碱基缺失为主;二者都是只含有CrRNA,不需要tracrRNA。二者的区别在于靶点的有效长度不同,蛋白的大小不同,以及识别的CrRNA不同。
已有的研究表明在拟南芥原生质体中CasΦ-2核酸酶突变类型主要造成基因组中8到10bp的缺失。
现有技术中,例如中国专利申请CN109306358A提供了利用CRISPR/Cas9 技术创制不包颈水稻两系不育系的方法,该方法根据水稻中EUI基因编码序列设计靶标序列,构建含靶标序列片段的pCRISPR/Cas9-EUI-gRNA重组载体;通过农杆菌转化水稻愈伤组织获得转基因苗;转基因苗经阳性筛选、测序分析、转基因元件检测,得到不含转基因成分的功能缺失突变体。
又例如中国专利申请CN106676130A提供的利用CRISPR-CAS9技术对水稻 BADH2基因定点突变的方法,针对水稻BADH2基因设计基于CRISPR/Cas9的 sgRNA序列,将含有编码所述sgRNA序列的DNA片段连接到携带CRISPR/Cas 的载体中,转化水稻,实现对水稻BADH2基因的定点突变。其中,sgRNA作用位点的核苷酸序列如SEQ ID NO:1所示。本发明通过CRISPR/CAS9技术对水稻内源基因BADH2进行编辑,获得了BADH2突变体,在创制香米种质资源上更为便捷高效。
又例如文献《CRISPR-CasΦfrom huge phages is a hypercompact genomeeditor》 (Patrick Pansch et al.)中公开了CRISPR-CasΦ系统,CasΦ使用单一活性位点进行CRISPR RNA(crRNA)处理和crRNA引导的DNA切割靶向外源核酸,能够在拟南芥原生质体中CasΦ-2核酸酶突变类型主要造成基因组中8到10bp的缺失。但是,对于CasΦ-2核酸酶在水稻基因编辑中是否能够成功应用,尚未提供相应的技术依据。
发明内容
针对以上现有技术的不足,本发明提供了用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体,通过探索CasΦ-2核酸酶在水稻基因编辑中的应用效果,拓宽了基因编辑的范围;具体通过以下技术实现。
一种用于水稻基因编辑的CasΦ-2蛋白,在所述CasΦ-2蛋白的氨基酸序列的N端增加1个核定位信号肽氨基酸序列,在C端增加3个核定位信号肽氨基酸序列。
CasΦ-2蛋白的切割DNA位置在靶点的12-18bp处,产生的突变多为碱基删除突变,可以有效避免Cas9的插入碱基和缺失突变范围小的缺点,可以根据实验目的达到小范围片段删除的需求。CasΦ-2蛋白的切割DNA的方式虽然与Cpf1 核酸酶类似,但CasΦ-2的靶点序列比较短(18-20bp),而Cpf1的靶点比较长,这点二者之间存在明显差别。
本发明提供的上述CasΦ-2蛋白在传统的核苷酸(或氨基酸)序列的基础上,根据水稻密码子的偏好,对其序列进行了优化,在N端增加1个核定位序列,在C端增加了3个核定位序列。通过上述优化,实现了CasΦ-2蛋白对水稻基因的编辑。
优选地,上述CasΦ-2蛋白,在所述CasΦ-2蛋白的氨基酸序列的N端增加的核定位信号肽氨基酸序列为SV40核定位信号肽氨基酸序列,在C端增加的3 个核定位信号肽氨基酸序列依次为2个SV40核定位信号肽氨基酸序列和1个 NLS核定位信号肽氨基酸序列。
优选地,上述CasΦ-2蛋白的氨基酸序列如SEQ ID NO.1所示,所述CasΦ-2 蛋白的核苷酸序列如SEQ ID NO.2所示。
本发明还提供了一种用于水稻基因编辑的CasΦ-2蛋白表达载体,在空白载体上含有上述任意一种CasΦ-2蛋白的核苷酸序列。这种CasΦ-2蛋白表达载体,能够通过与CasΦ-2蛋白的CrRNA表达盒子一起组装,获得相应的CasΦ-2蛋白的完整表达载体。
优选地,上述CasΦ-2蛋白表达载体中,所用的所述空白载体为 pCAMBIA1300载体,转录CasΦ-2蛋白的核苷酸使用玉米UBI启动子和NOS 终止子;所述玉米UBI启动子的核苷酸序列如SEQ ID NO.3所示,所述NOS终止子的核苷酸序列如SEQ ID NO.4所示。
作为一种优选方式,上述CasΦ-2蛋白表达载体,可以使用玉米UBI启动子 (核苷酸序列如SEQ NO.4所示),转录上述CasΦ-2蛋白的核苷酸序列,并使用NOS终止子(核苷酸序列如SEQ NO.5所示),最终克隆到空白载体上构成。
本发明还提供了一种用于水稻基因编辑的CasΦ-2蛋白的CrRNA表达盒子,包括CrRNA表达盒空载和针对相应的水稻基因设计的基因编辑靶点;
所述CrRNA表达盒空载包括上述CasΦ-2蛋白的CrRNA,还包括针对转录相应的水稻基因编辑靶点的启动子,并且所述CrRNA的核苷酸序列的两端分别设有1个tRNA序列。
上述CasΦ-2蛋白的CrRNA表达盒子是针对某个特定的水稻基因先设计基因编辑靶点序列,将转录基因编辑靶点的启动子、CrRNA、tRNA组装成CrRNA 表达盒空载,再将基因编辑靶点、CrRNA表达盒空载组装连接在一起后构成。基因编辑靶点可以根据选取的水稻基因片段针对性地进行设计。CasΦ-2蛋白的 CrRNA在两端各加一个tRNA序列,目的是提高CrRNA在水稻细胞内的产生效率;另外,可以选用水稻OsU6a启动子转录上述CasΦ-2的CrRNA。
优选地,上述CasΦ-2蛋白的CrRNA表达盒子中,针对的水稻基因为OsBEL 基因,所述基因编辑靶点的核苷酸序列如SEQ ID NO.5所示,启动所述水稻基因OsBEL的靶点的OsU6a启动子的核苷酸序列如SEQ ID NO.6所示;所述 CasΦ-2蛋白的CrRNA的核苷酸序列如SEQ ID NO.7所示;所述tRNA序列的核苷序列如SEQ ID NO.8所示;所述CrRNA表达盒空载的核苷序列如SEQ ID NO.9 所示;
组装所述的CasΦ-2蛋白的CrRNA表达盒子所用的引物为:
BEL-F:ggacCATCTCCTTCTAGAAGCACA;
BEL-R:tgttTGTGCTTCTAGAAGGAGATG;
组装的具体方式为:取引物1μl BEL-F、1μl BEL-R、8μl无菌水,(放入EP 管中),在PCR扩增仪上,先在95℃变性,再在55℃退火后,得到BEL引物混合液;再取1μl BEL引物混合液,与30ng CrRNA表达盒空载、1μl 10×CutSmart Buffer、35U T4 DNA连接酶、10U Bsal限制性内切酶和无菌水组成10μl混合体系,37℃培养1h,制得所述CasΦ-2蛋白的CrRNA表达盒子OsU6a-CrRNA-BEL。
上述表达盒子OsU6a-CrRNA-BEL的验证方式为:将产物混合液转化进入大肠杆菌感受肽细胞中,然后再经过菌检,测序确认后即可。
本发明还提供了一种用于水稻基因编辑的CasΦ-2蛋白完整表达载体,所述 CasΦ-2蛋白完整表达载体上连接有权利要求4或5所述的CasΦ-2蛋白表达载体,还连接有权利要求6或7所述的CasΦ-2蛋白的CrRNA表达盒子。
优选地,上述CasΦ-2蛋白完整表达载体,是先使用引物Pps-R和Pgs-L对 CasΦ-2蛋白的CrRNA表达盒子进行扩增,再用BsaI和T4 DNA连接酶与所述 CasΦ-2蛋白表达载体组装连接后构成;
所述引物Pps-R和Pgs-L为:
Pps-R:TAGAggtctcTaccgACTAGTATGGAATCGGCAGCAAAGG;
Pgs-L:AGTGggtctcGctcgACGCGTATCCATCCACTCCAAGCTC。
采用上述方式制备得到的CasΦ-2蛋白完整表达载体,可以借助于工程化的农杆菌EHA105转化到水稻愈伤组织中表达。
优选地,CasΦ-2蛋白完整表达载体的核苷酸序列如SEQ ID NO.10所示。
与现有技术相比,本发明的有益之处在于:本发明提供了一种用于水稻基因编辑的CasΦ-2蛋白,并基于该CasΦ-2蛋白获得了一种CasΦ-2蛋白表达载体和CrRNA表达盒子,以及组装CasΦ-2蛋白表达载体和CrRNA表达盒子后获得的 CasΦ-2蛋白的完整表达载体,将该完整表达载体转化EHA105农杆菌后侵染水稻愈伤组织,能够实现上述完整表达载体在水稻愈伤组织中的表达,实现水稻基因的敲除编辑。
附图说明
图1为实施例的CasΦ-2蛋白的CrRNA表达盒子OsU6a-CrRNA-BEL载体的结构;
图2为实施例的CasΦ-2蛋白表达载体的结构;
图3为实施例的CasΦ-2蛋白的CrRNA表达盒空载的结构示意图;
图4为实施例的CasΦ-2蛋白的不含靶点的表达载体pEGCasΦ-2Pubi-H- OsU6a-CrRNA的结构示意图;
图5为实施例的CasΦ-2蛋白的完整表达载体pEGCasΦ-2Pubi-H-OsU6a -CrRNA-BEL的结构示意图;
图6为实施例的BEL-11和BEL-31扩增条带电泳示意图;
图7为实施例的BEL-11样本测序分析结果示意图;
图8为实施例的BEL-31样本测序分析结果示意图。
具体实施方式
下面将对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动条件下所获得的所有其它实施例,都属于本发明保护的范围。
实施例
本实施例选取水稻的OsBEL基因(LOC_Os03g55240)为研究对象进行试验,具体试验步骤如下:
1、设计OsBEL基因编辑靶点:TTTCATCTCCTTCTAGAAGCACA,PAM 位点为TTT,如SEQID NO.5所示。
2、靶点组装,获得CasΦ-2蛋白的CrRNA表达盒子
将上述OsBEL基因编辑靶点、OsU6a启动子(核苷酸序列如SEQ ID NO.6 所示)、CrRNA(核苷酸序列如SEQ ID NO.7所示)进行组装;
OsBEL基因编辑靶点组装所用的引物如下:
BEL-F:ggacCATCTCCTTCTAGAAGCACA;
BEL-R:tgttTGTGCTTCTAGAAGGAGATG;
组装的具体方式为:取引物1μl BEL-F、1μl BEL-R、8μl无菌水,(放入EP 管中),在PCR扩增仪上,先在95℃变性,再在55℃退火后,得到BEL引物混合液;再取1μl BEL引物混合液,与30ng CrRNA表达盒空载、1μl 10×CutSmart Buffer、35U T4 DNA连接酶、10U Bsal限制性内切酶和无菌水组成10μl混合体系,37℃培养1h;
连接完成的混合液转化进入大肠杆菌感受肽细胞中,经过菌检,测序确认,最终组成所述CasΦ-2蛋白的CrRNA表达盒子OsU6a-CrRNA-BEL。
上述CasΦ-2蛋白的CrRNA表达盒子OsU6a-CrRNA-BEL是由CrRNA表达盒空载和水稻基因OsBEL的基因编辑靶点组成;CrRNA表达盒空载上包括 CasΦ-2蛋白的CrRNA,还包括转录水稻基因OsBEL靶点的OsU6a启动子,并且所述CrRNA的核苷酸序列的两端分别设有1个tRNA序列,如附图3所示;表达盒子的具体结构示意图如图1所示,图1中,CrRNA的两段分别设有1个 tRNA序列,T位置用于组装连接靶点序列BEL;
所述tRNA序列的核苷酸序列如SEQ ID NO.8所示;CrRNA表达盒空载的核苷酸序列如SEQ ID NO.9所示;
3、构建CasΦ-2蛋白表达载体
选用空白载体pCAMBIA1300,使用玉米UBI启动子(如SEQ ID NO.3所示)转录CasΦ-2蛋白的核苷酸序列,使用NOS终止子(如SEQ ID NO.4所示),并克隆到pCAMBIA1300上构建成CasΦ-2水稻表达载体;在空白载体上组装 CasΦ-2蛋白的核苷酸序列,获得用于水稻基因OsBEL基因编辑的CasΦ-2蛋白表达载体;CasΦ-2蛋白的氨基酸序列如SEQ ID NO.1所示,核苷酸序列如SEQ ID NO.2所示,核苷酸中含有终止子TAG;表达载体的具体结构示意图如图2所示,图2中在CasΦ-2蛋白的核苷酸序列的左侧(N端)有1个SV40核定位信号肽的核苷酸序列,右侧(C端)有2个SV40核定位信号肽的核苷酸序列和1个 NLS核定位信号肽的核苷酸序列;
CasΦ-2蛋白表达载体的组装方式具体为:
(1)改造pCAMBIA1300载体
CCDB-F:GctatgaccatgattacgaattcCTCGAGAGACCTCTGAAGTG
CCDB-R:AcgacggccagtgccaagcttACCGCGAGACCCACGCTCACC
先把pCAMBIA1300载体使用EcoRI/HindIII双酶切;
酶切体系为:2μg pCAMBIA1300载体、1μl EcoRI限制性内切酶、1μl HindIII 限制性内切酶、5μl 10×FastDigest Green Buffer,加无菌水至50μl,然后在37℃培养箱中反应1小时,使用胶回收试剂盒回收酶切后的pCAMBIA1300载体;
使用引物CCDB-F和CCDB-R,扩增含有BsaI酶切位点的ccdB结构,扩增体系如下:
Figure RE-GDA0003302200160000071
PCR反应参数:
Figure RE-GDA0003302200160000072
然后使用胶回收试剂盒回收扩增的CCDB片段;
(2)pEG-ccdB中间载体的构建
使用Gibson assembly的方式构建pEG-ccdB空载;
反应体系为:5μl Gibson assembly mix、50ng酶切后的pCAMBIA1300载体、 50ngCCDB回收片段,加水至10μl,在PCR仪器上反应30min,然后把反应液转化进入DB3.1大肠杆菌感受肽细胞中,然后再经过菌检,测序确认,最终组成所述pEG-ccdB中间载体;
(3)CasΦ-2表达载体空载体的构建
UBI-F:AGTGggtctcGctcgCGGCCATGCGGCCGCAAGCTGGGT
UBI-R:TAGAggtctcTGGTGGCTGCAGAAGTAACACCAAACAACA
CasF2-F:AGTGggtctcGCACCATGCCGAAGAAGAAGCGCAAGGTGTCC CasF2-R:TAGAggtctcTTCACCGCTACTTCTTTTTCTTAGCCTGTCCGGCC TTTTTGG
NOS-F:AGTGggtctcGGTGATCCTCCCGATCGTTCAAACA
NOS-R:TAGAggtctcTaccgGGCGCGCCTGCTCCCGATCTAGTAAC
使用上述三对引物,分别扩增UBI启动子片段和NOS序列,上述两个序列的模板为pYLCRISPR/Cas9Pubi-H载体(来自于华南农业大学刘耀光院士实验室赠送),以及CasΦ-2序列模板是按照SEQ ID NO.2全基因合成而来;扩增体系和反应条件参照上述步骤(1);
使用胶回收试剂盒回收上述3个片段,用Golden Gate的方式进行酶切连接:酶连体系100ng UBI片段、20ng NOS片段、100ng CasΦ-2片段、50ng pEG-ccdB、 1μl 10×CutSmart Buffer、35U的T4 DNA连接酶、10U的BsaI限制性内切酶、无菌水组成混合体系10μl,在37℃培养箱中反应1h,连接完成的混合液转化进入DH5α大肠杆菌感受肽细胞中,然后再经过菌检,测序确认,最终组成所述的 CasΦ-2蛋白表达载体。
4、构建用于水稻基因OsBEL编辑的CasΦ-2蛋白完整表达载体 pEGCasΦ-2Pubi-H-OsU6a-CrRNA-BEL
组装CasΦ-2蛋白完整表达载体的引物如下:
Pps-R:TAGAggtctcTaccgACTAGTATGGAATCGGCAGCAAAGG;
Pgs-L:AGTGggtctcGctcgACGCGTATCCATCCACTCCAAGCTC;
先使用上述引物Pps-R和Pgs-L,对CasΦ-2蛋白的CrRNA表达盒子 OsU6a-CrRNA-BEL进行PCR扩增,CasΦ-2蛋白的CrRNA表达盒扩增体系如下:
Figure RE-GDA0003302200160000081
PCR反应参数:
Figure RE-GDA0003302200160000082
Figure RE-GDA0003302200160000091
再使用BsaI和T4 DNA连接酶,将CrRNA表达盒子OsU6a-CrRNA-BEL与所述CasΦ-2蛋白表达载体,用Golden Gate的方式进行组装连接,构建得到完整的CasΦ-2蛋白完整表达载体pEGCasΦ-2Pubi-H-OsU6a-CrRNA-BEL,核苷酸序列如SEQ ID NO.10所示,图4中的T位置即CasΦ-2蛋白完整表达载体中BEL 靶点组装的位置,图5即完成BEL靶点组装的CasΦ-2蛋白完整表达载体的示意图。
5、CasΦ-2蛋白完整表达载体pEGCasΦ-2Pubi-H-OsU6a-CrRNA-BEL的遗传转化
把构建得到的完整表达载体pEGCasΦ-2Pubi-H-OsU6a-CrRNA-BEL,转化 EHA105农杆菌后侵染水稻愈伤组织,经过潮霉素B抗生素2次筛选水稻愈伤组织,分化和生根成完整水稻幼苗,进行分子水平检测鉴定。
6、水稻基因OsBEL的突变类型的检测
(1)设计检测引物(扩增条带544bp)
BEL(det+):GGAGTGAGTAGAAGTAATCGCC
BEL(det-):AGGTCACGTCGTGCTCGGTGAA
(2)PCR扩增条件
使用上述BEL(det+)、BEL(det-)这对引物进行PCR扩增,扩增体系如下:
Figure RE-GDA0003302200160000092
PCR反应参数如下:
Figure RE-GDA0003302200160000093
Figure RE-GDA0003302200160000101
使用1.5%的琼脂糖凝胶电泳对PCR产物进行分析,。从附图6可以看到, BEL-11和BEL-31样本为右侧两道明亮的条带,约在544bp附近。
(3)对PCR产物sanger测序分析
把上述81个样本的PCR产物送去进行sanger测序,测序结果使用DSDecode 软件分析结果,其中有2个样本被编辑结果如附图7、8所示。从附图7、8可以看到,本发明实验总共测序样品81个,其中只有BEL-11和BEL-31两个样品被编辑,编辑效率2.5%,经过DSDecode软件解码分析BEL-11和BEL-31样品的 Sanger测序数据显示,BEL-11样品缺失11个碱基,BEL-31样品缺失18个碱基。由此证明了,采用上述方法获得的CasΦ-2蛋白的完整表达载体pEGCasΦ-2Pubi-H-OsU6a-CrRNA-BEL能够对水稻基因OsBEL起到基因敲除编辑的作用。
序列表
<110> 武汉艾迪晶生物科技有限公司
<120> 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 810
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Pro Lys Pro Ala
1 5 10 15
Val Glu Ser Glu Phe Ser Lys Val Leu Lys Lys His Phe Pro Gly Glu
20 25 30
Arg Phe Arg Ser Ser Tyr Met Lys Arg Gly Gly Lys Ile Leu Ala Ala
35 40 45
Gln Gly Glu Glu Ala Val Val Ala Tyr Leu Gln Gly Lys Ser Glu Glu
50 55 60
Glu Pro Pro Asn Phe Gln Pro Pro Ala Lys Cys His Val Val Thr Lys
65 70 75 80
Ser Arg Asp Phe Ala Glu Trp Pro Ile Met Lys Ala Ser Glu Ala Ile
85 90 95
Gln Arg Tyr Ile Tyr Ala Leu Ser Thr Thr Glu Arg Ala Ala Cys Lys
100 105 110
Pro Gly Lys Ser Ser Glu Ser His Ala Ala Trp Phe Ala Ala Thr Gly
115 120 125
Val Ser Asn His Gly Tyr Ser His Val Gln Gly Leu Asn Leu Ile Phe
130 135 140
Asp His Thr Leu Gly Arg Tyr Asp Gly Val Leu Lys Lys Val Gln Leu
145 150 155 160
Arg Asn Glu Lys Ala Arg Ala Arg Leu Glu Ser Ile Asn Ala Ser Arg
165 170 175
Ala Asp Glu Gly Leu Pro Glu Ile Lys Ala Glu Glu Glu Glu Val Ala
180 185 190
Thr Asn Glu Thr Gly His Leu Leu Gln Pro Pro Gly Ile Asn Pro Ser
195 200 205
Phe Tyr Val Tyr Gln Thr Ile Ser Pro Gln Ala Tyr Arg Pro Arg Asp
210 215 220
Glu Ile Val Leu Pro Pro Glu Tyr Ala Gly Tyr Val Arg Asp Pro Asn
225 230 235 240
Ala Pro Ile Pro Leu Gly Val Val Arg Asn Arg Cys Asp Ile Gln Lys
245 250 255
Gly Cys Pro Gly Tyr Ile Pro Glu Trp Gln Arg Glu Ala Gly Thr Ala
260 265 270
Ile Ser Pro Lys Thr Gly Lys Ala Val Thr Val Pro Gly Leu Ser Pro
275 280 285
Lys Lys Asn Lys Arg Met Arg Arg Tyr Trp Arg Ser Glu Lys Glu Lys
290 295 300
Ala Gln Asp Ala Leu Leu Val Thr Val Arg Ile Gly Thr Asp Trp Val
305 310 315 320
Val Ile Asp Val Arg Gly Leu Leu Arg Asn Ala Arg Trp Arg Thr Ile
325 330 335
Ala Pro Lys Asp Ile Ser Leu Asn Ala Leu Leu Asp Leu Phe Thr Gly
340 345 350
Asp Pro Val Ile Asp Val Arg Arg Asn Ile Val Thr Phe Thr Tyr Thr
355 360 365
Leu Asp Ala Cys Gly Thr Tyr Ala Arg Lys Trp Thr Leu Lys Gly Lys
370 375 380
Gln Thr Lys Ala Thr Leu Asp Lys Leu Thr Ala Thr Gln Thr Val Ala
385 390 395 400
Leu Val Ala Ile Asp Leu Gly Gln Thr Asn Pro Ile Ser Ala Gly Ile
405 410 415
Ser Arg Val Thr Gln Glu Asn Gly Ala Leu Gln Cys Glu Pro Leu Asp
420 425 430
Arg Phe Thr Leu Pro Asp Asp Leu Leu Lys Asp Ile Ser Ala Tyr Arg
435 440 445
Ile Ala Trp Asp Arg Asn Glu Glu Glu Leu Arg Ala Arg Ser Val Glu
450 455 460
Ala Leu Pro Glu Ala Gln Gln Ala Glu Val Arg Ala Leu Asp Gly Val
465 470 475 480
Ser Lys Glu Thr Ala Arg Thr Gln Leu Cys Ala Asp Phe Gly Leu Asp
485 490 495
Pro Lys Arg Leu Pro Trp Asp Lys Met Ser Ser Asn Thr Thr Phe Ile
500 505 510
Ser Glu Ala Leu Leu Ser Asn Ser Val Ser Arg Asp Gln Val Phe Phe
515 520 525
Thr Pro Ala Pro Lys Lys Gly Ala Lys Lys Lys Ala Pro Val Glu Val
530 535 540
Met Arg Lys Asp Arg Thr Trp Ala Arg Ala Tyr Lys Pro Arg Leu Ser
545 550 555 560
Val Glu Ala Gln Lys Leu Lys Asn Glu Ala Leu Trp Ala Leu Lys Arg
565 570 575
Thr Ser Pro Glu Tyr Leu Lys Leu Ser Arg Arg Lys Glu Glu Leu Cys
580 585 590
Arg Arg Ser Ile Asn Tyr Val Ile Glu Lys Thr Arg Arg Arg Thr Gln
595 600 605
Cys Gln Ile Val Ile Pro Val Ile Glu Asp Leu Asn Val Arg Phe Phe
610 615 620
His Gly Ser Gly Lys Arg Leu Pro Gly Trp Asp Asn Phe Phe Thr Ala
625 630 635 640
Lys Lys Glu Asn Arg Trp Phe Ile Gln Gly Leu His Lys Ala Phe Ser
645 650 655
Asp Leu Arg Thr His Arg Ser Phe Tyr Val Phe Glu Val Arg Pro Glu
660 665 670
Arg Thr Ser Ile Thr Cys Pro Lys Cys Gly His Cys Glu Val Gly Asn
675 680 685
Arg Asp Gly Glu Ala Phe Gln Cys Leu Ser Cys Gly Lys Thr Cys Asn
690 695 700
Ala Asp Leu Asp Val Ala Thr His Asn Leu Thr Gln Val Ala Leu Thr
705 710 715 720
Gly Lys Thr Met Pro Lys Arg Glu Glu Pro Arg Asp Ala Gln Gly Thr
725 730 735
Ala Pro Ala Arg Lys Thr Lys Lys Ala Ser Lys Ser Lys Ala Pro Pro
740 745 750
Ala Glu Arg Glu Asp Gln Thr Pro Ala Gln Glu Pro Ser Gln Thr Ser
755 760 765
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Pro
770 775 780
Lys Lys Lys Arg Lys Val Ser Gly Gly Ser Lys Arg Pro Ala Ala Thr
785 790 795 800
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
805 810
<210> 2
<211> 2433
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgccgaaga agaagcgcaa ggtgtccggc ggctccccga agccagccgt ggagagcgag 60
ttctccaagg tgctcaagaa gcacttccca ggcgagcgct tccgcagcag ctacatgaag 120
cgcggcggca agatcctcgc cgcccagggc gaggaggccg tggtcgccta cctccagggc 180
aagtccgagg aggagccgcc gaacttccag ccgccagcga agtgccacgt cgtgaccaag 240
tcccgcgact tcgccgagtg gccgatcatg aaggcgtccg aggcgatcca gcgctacatc 300
tacgccctca gcaccacaga gcgggccgcg tgcaagccgg gcaagtcctc tgagtcccac 360
gcggcctggt tcgccgccac cggcgtgagc aaccacggct actcccacgt gcagggcctc 420
aacctgatct tcgaccacac actcggcagg tacgatggcg tgctgaagaa ggtccagctt 480
aggaacgaga aggctagggc tcgcctggaa tcgattaacg cctcgcgggc tgatgagggt 540
cttcctgaaa ttaaggctga agaggaagag gtcgcaacca atgaaaccgg tcatcttttg 600
cagcctccgg gcataaaccc gtccttctac gtctaccaaa ctatatctcc tcaggcctat 660
agacctcgcg acgaaatagt cctcccccct gagtatgccg gttatgtgag ggacccgaat 720
gcccccattc cgttgggcgt cgtccgtaat cgttgcgaca tacaaaaggg ctgcccagga 780
tacatcccag agtggcagcg cgaagccgga acagcaataa gccccaagac cgggaaggcg 840
gttacggttc caggactttc tcctaagaag aataagcgca tgaggagata ttggcggtca 900
gagaaggaaa aggcccagga tgcgctgttg gtcacagtta ggattggcac ggactgggtc 960
gtaattgacg ttagaggcct gcttagaaat gccagatgga ggacgattgc ccccaaggac 1020
atctccttga acgctctcct ggatctcttt actggcgatc cggtgatcga tgttagaagg 1080
aatatagtga cgtttactta cacacttgac gcgtgcggta catacgctcg caagtggacg 1140
cttaagggaa agcaaaccaa ggcgacgttg gataagctga cggcaaccca aaccgtggca 1200
ttggtagcta ttgacttggg ccagacaaat ccgatttcag ccggaatctc gagggtcaca 1260
caggaaaatg gagcactcca gtgcgaaccc ttggaccggt tcaccctccc agacgacctg 1320
ctcaaggata tcagcgccta caggattgca tgggaccgca atgaggagga gttgagagcg 1380
cggagcgttg aggcactccc agaagctcaa caagcggagg tcagggcatt ggacggtgta 1440
tcaaaggaaa ccgcccgtac ccagctctgt gcggatttcg gccttgaccc gaaacgcctc 1500
ccttgggaca agatgagctc gaatacgacc ttcatctcag aggcgcttct gtcgaattcc 1560
gtgtcccgtg atcaggtgtt ctttacaccg gctccgaaga aaggggccaa gaagaaggcc 1620
ccggttgagg taatgcgcaa agataggacg tgggctaggg cgtacaaacc acgcctctct 1680
gtggaggcgc agaaactcaa gaacgaagcc ttgtgggctt tgaaaaggac ctccccggaa 1740
tatctgaagc tgtctcgccg taaagaggaa ctctgtcgcc gttcgatcaa ttacgtcatc 1800
gagaagaccc gtaggagaac tcagtgccag attgtgattc cggtaatcga ggacctgaac 1860
gtccggtttt ttcacggctc cggcaaaaga cttcccggtt gggataactt ctttaccgca 1920
aagaaggaaa ataggtggtt catacagggc cttcataagg ccttctctga tctgagaacg 1980
catcgttcct tttacgtgtt cgaggtgcgg ccggaacgca cctctattac ttgccccaaa 2040
tgtggccact gtgaagtcgg caatcgcgat ggggaggcat tccaatgtct gtcgtgtgga 2100
aagacttgta atgctgatct cgacgtagcg acccacaatc ttacccaggt tgcgctgacg 2160
ggcaagacca tgccaaagag ggaggaacca cgtgacgcac aaggaaccgc accggctagg 2220
aagacaaaga aagcctcgaa atcaaaagct cctccggccg aaagagagga tcagactccg 2280
gctcaggagc catcccagac gtcttccggc ggcagcccta agaagaagcg gaaggtttct 2340
ggaggttctc cgaagaagaa gcgcaaggtg tccggcggct ccaagcgtcc tgctgccacc 2400
aaaaaggccg gacaggctaa gaaaaagaag tag 2433
<210> 3
<211> 1987
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct 840
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc 900
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc 960
ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct 1020
agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt 1080
tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac 1140
gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc 1200
tctagccgtt ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt 1260
tggtttgccc ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt 1320
tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc 1380
ggagtagaat tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg 1440
tgccatacat attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata 1500
ggtatacatg ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg 1560
gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac 1620
tgtttcaaac tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct 1680
tcatagttac gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat 1740
gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac 1800
cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat 1860
acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg 1920
ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact 1980
tctgcag 1987
<210> 4
<211> 253
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60
atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120
atgacgttat ttatgaggtg ggtttttatg attagagtcc cgcaattata catttaatac 180
gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240
atgttactag atc 253
<210> 5
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tttcatctcc ttctagaagc aca 23
<210> 6
<211> 448
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
attttttcct gtagttttcc cacaaccatt ttttaccatc cgaatgatag gataggaaaa 60
atatccaagt gaacagtatt cctataaaat tcccgtaaaa agcctgcaat ccgaatgagc 120
cctgaagtct gaactagccg gtcacctgta caggctatcg agatgccata caagagacgg 180
tagtaggaac taggaagacg atggttgatt cgtcaggcga aatcgtcgtc ctgcagtcgc 240
atctatgggc ctggacggaa taggggaaaa agttggccgg ataggaggga aaggcccagg 300
tgcttacgtg cgaggtaggc ctgggctctc agcacttcga ttcgttggca ccggggtagg 360
atgcaataga gagcaacgtt tagtaccacc tcgcttagct agagcaaact ggactgcctt 420
atatgcgcgg gtgctggctt ggctgccg 448
<210> 7
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
caacgattgc ccctcacgag gggac 25
<210> 8
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 9
<211> 2534
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cacatttcgt aaaacgacgg ccagtgaatt cggatccaag cttactagta tggaatcggc 60
agcaaaggat tttttcctgt agttttccca caaccatttt ttaccatccg aatgatagga 120
taggaaaaat atccaagtga acagtattcc tataaaattc ccgtaaaaag cctgcaatcc 180
gaatgagccc tgaagtctga actagccggt cacctgtaca ggctatcgag atgccataca 240
agagacggta gtaggaacta ggaagacgat ggttgattcg tcaggcgaaa tcgtcgtcct 300
gcagtcgcat ctatgggcct ggacggaata ggggaaaaag ttggccggat aggagggaaa 360
ggcccaggtg cttacgtgcg aggtaggcct gggctctcag cacttcgatt cgttggcacc 420
ggggtaggat gcaatagaga gcaacgttta gtaccacctc gcttagctag agcaaactgg 480
actgccttat atgcgcgggt gctggcttgg ctgccgaaca aagcaccagt ggtctagtgg 540
tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt gcacaacgat 600
tgcccctcac gaggggacag agaccactgt ccgtcagatg ggtctcgaac aaagcaccag 660
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 720
tgcatttttt tcaagagctt ggagtggatg gaacgcgtct gcaggagctc ctcgagggtc 780
atagctgttt cctgcgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 840
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 900
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 960
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 1020
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 1080
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 1140
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 1200
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 1260
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 1320
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 1380
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 1440
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 1500
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1560
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 1620
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 1680
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 1740
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 1800
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 1860
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 1920
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 1980
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 2040
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 2100
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 2160
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 2220
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 2280
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 2340
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 2400
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 2460
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 2520
ataggggttc cgcg 2534
<210> 10
<211> 14363
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc 60
aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta tgcttccggc 120
tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca gctatgacat 180
gattacgaat tccggccatg cggccgcaag ctgggtgcag cgtgacccgg tcgtgcccct 240
ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 300
tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttactctac 360
gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 420
cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 480
ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 540
catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 600
tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 660
tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 720
taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 780
gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 840
cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 900
ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 960
gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 1020
ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta 1080
ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac 1140
acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc 1200
tcgtcctccc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag 1260
ggcccggtag ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt 1320
gctgctagcg ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt 1380
gccagtgttt ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga 1440
tttcatgatt ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa 1500
tatatgccgt gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg 1560
atgatgtggt ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc 1620
tggtggattt attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat 1680
tgaagatgat ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac 1740
tgatgcatat acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc 1800
ggtcgttcat tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat 1860
taattttgga actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg 1920
gaaatatcga tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg 1980
atggcatatg cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa 2040
caagtatgtt ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc 2100
tatatgtgga tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct 2160
tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca gccaccatgc cgaagaagaa 2220
gcgcaaggtg tccggcggct ccccgaagcc agccgtggag agcgagttct ccaaggtgct 2280
caagaagcac ttcccaggcg agcgcttccg cagcagctac atgaagcgcg gcggcaagat 2340
cctcgccgcc cagggcgagg aggccgtggt cgcctacctc cagggcaagt ccgaggagga 2400
gccgccgaac ttccagccgc cagcgaagtg ccacgtcgtg accaagtccc gcgacttcgc 2460
cgagtggccg atcatgaagg cgtccgaggc gatccagcgc tacatctacg ccctcagcac 2520
cacagagcgg gccgcgtgca agccgggcaa gtcctctgag tcccacgcgg cctggttcgc 2580
cgccaccggc gtgagcaacc acggctactc ccacgtgcag ggcctcaacc tgatcttcga 2640
ccacacactc ggcaggtacg atggcgtgct gaagaaggtc cagcttagga acgagaaggc 2700
tagggctcgc ctggaatcga ttaacgcctc gcgggctgat gagggtcttc ctgaaattaa 2760
ggctgaagag gaagaggtcg caaccaatga aaccggtcat cttttgcagc ctccgggcat 2820
aaacccgtcc ttctacgtct accaaactat atctcctcag gcctatagac ctcgcgacga 2880
aatagtcctc ccccctgagt atgccggtta tgtgagggac ccgaatgccc ccattccgtt 2940
gggcgtcgtc cgtaatcgtt gcgacataca aaagggctgc ccaggataca tcccagagtg 3000
gcagcgcgaa gccggaacag caataagccc caagaccggg aaggcggtta cggttccagg 3060
actttctcct aagaagaata agcgcatgag gagatattgg cggtcagaga aggaaaaggc 3120
ccaggatgcg ctgttggtca cagttaggat tggcacggac tgggtcgtaa ttgacgttag 3180
aggcctgctt agaaatgcca gatggaggac gattgccccc aaggacatct ccttgaacgc 3240
tctcctggat ctctttactg gcgatccggt gatcgatgtt agaaggaata tagtgacgtt 3300
tacttacaca cttgacgcgt gcggtacata cgctcgcaag tggacgctta agggaaagca 3360
aaccaaggcg acgttggata agctgacggc aacccaaacc gtggcattgg tagctattga 3420
cttgggccag acaaatccga tttcagccgg aatctcgagg gtcacacagg aaaatggagc 3480
actccagtgc gaacccttgg accggttcac cctcccagac gacctgctca aggatatcag 3540
cgcctacagg attgcatggg accgcaatga ggaggagttg agagcgcgga gcgttgaggc 3600
actcccagaa gctcaacaag cggaggtcag ggcattggac ggtgtatcaa aggaaaccgc 3660
ccgtacccag ctctgtgcgg atttcggcct tgacccgaaa cgcctccctt gggacaagat 3720
gagctcgaat acgaccttca tctcagaggc gcttctgtcg aattccgtgt cccgtgatca 3780
ggtgttcttt acaccggctc cgaagaaagg ggccaagaag aaggccccgg ttgaggtaat 3840
gcgcaaagat aggacgtggg ctagggcgta caaaccacgc ctctctgtgg aggcgcagaa 3900
actcaagaac gaagccttgt gggctttgaa aaggacctcc ccggaatatc tgaagctgtc 3960
tcgccgtaaa gaggaactct gtcgccgttc gatcaattac gtcatcgaga agacccgtag 4020
gagaactcag tgccagattg tgattccggt aatcgaggac ctgaacgtcc ggttttttca 4080
cggctccggc aaaagacttc ccggttggga taacttcttt accgcaaaga aggaaaatag 4140
gtggttcata cagggccttc ataaggcctt ctctgatctg agaacgcatc gttcctttta 4200
cgtgttcgag gtgcggccgg aacgcacctc tattacttgc cccaaatgtg gccactgtga 4260
agtcggcaat cgcgatgggg aggcattcca atgtctgtcg tgtggaaaga cttgtaatgc 4320
tgatctcgac gtagcgaccc acaatcttac ccaggttgcg ctgacgggca agaccatgcc 4380
aaagagggag gaaccacgtg acgcacaagg aaccgcaccg gctaggaaga caaagaaagc 4440
ctcgaaatca aaagctcctc cggccgaaag agaggatcag actccggctc aggagccatc 4500
ccagacgtct tccggcggca gccctaagaa gaagcggaag gtttctggag gttctccgaa 4560
gaagaagcgc aaggtgtccg gcggctccaa gcgtcctgct gccaccaaaa aggccggaca 4620
ggctaagaaa aagaagtagc ggtgatcctc ccgatcgttc aaacatttgg caataaagtt 4680
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt 4740
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgagg tgggttttta 4800
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa 4860
actaggataa attatcgcgc gcggtgtcat ctatgttact agatcgggag caccggtaag 4920
gctcgacgcg ttccatccac tccaagctct tgaaaaaaat gcaccagccg ggaatcgaac 4980
ccgggtctgt accgtggcag ggtactattc taccactaga ccactggtgc tttgtttgtg 5040
cttctagaag gagatggtcc cctcgtgagg ggcaatcgtt gtgcaccagc cgggaatcga 5100
acccgggtct gtaccgtggc agggtactat tctaccacta gaccactggt gctttgttcg 5160
gcagccaagc cagcacccgc gcatataagg cagtccagtt tgctctagct aagcgaggtg 5220
gtactaaacg ttgctctcta ttgcatccta ccccggtgcc aacgaatcga agtgctgaga 5280
gcccaggcct acctcgcacg taagcacctg ggcctttccc tcctatccgg ccaacttttt 5340
cccctattcc gtccaggccc atagatgcga ctgcaggacg acgatttcgc ctgacgaatc 5400
aaccatcgtc ttcctagttc ctactaccgt ctcttgtatg gcatctcgat agcctgtaca 5460
ggtgaccggc tagttcagac ttcagggctc attcggattg caggcttttt acgggaattt 5520
tataggaata ctgttcactt ggatattttt cctatcctat cattcggatg gtaaaaaatg 5580
gttgtgggaa aactacagga aaaaatcctt tgctgccgat tccatactag tcggtccgta 5640
gtgaagcttg gcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 5700
ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 5760
ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatgct agagcagctt 5820
gagcttggat cagattgtcg tttcccgcct tcagtttaaa ctatcagtgt ttgacaggat 5880
atattggcgg gtaaacctaa gagaaaagag cgtttattag aataacggat atttaaaagg 5940
gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca gggttcccct 6000
cgggatcaaa gtactttgat ccaacccctc cgctgctata gtgcagtcgg cttctgacgt 6060
tcagtgcagc cgtcttctga aaacgacatg tcgcacaagt cctaagttac gcgacaggct 6120
gccgccctgc ccttttcctg gcgttttctt gtcgcgtgtt ttagtcgcat aaagtagaat 6180
acttgcgact agaaccggag acattacgcc atgaacaaga gcgccgccgc tggcctgctg 6240
ggctatgccc gcgtcagcac cgacgaccag gacttgacca accaacgggc cgaactgcac 6300
gcggccggct gcaccaagct gttttccgag aagatcaccg gcaccaggcg cgaccgcccg 6360
gagctggcca ggatgcttga ccacctacgc cctggcgacg ttgtgacagt gaccaggcta 6420
gaccgcctgg cccgcagcac ccgcgaccta ctggacattg ccgagcgcat ccaggaggcc 6480
ggcgcgggcc tgcgtagcct ggcagagccg tgggccgaca ccaccacgcc ggccggccgc 6540
atggtgttga ccgtgttcgc cggcattgcc gagttcgagc gttccctaat catcgaccgc 6600
acccggagcg ggcgcgaggc cgccaaggcc cgaggcgtga agtttggccc ccgccctacc 6660
ctcaccccgg cacagatcgc gcacgcccgc gagctgatcg accaggaagg ccgcaccgtg 6720
aaagaggcgg ctgcactgct tggcgtgcat cgctcgaccc tgtaccgcgc acttgagcgc 6780
agcgaggaag tgacgcccac cgaggccagg cggcgcggtg ccttccgtga ggacgcattg 6840
accgaggccg acgccctggc ggccgccgag aatgaacgcc aagaggaaca agcatgaaac 6900
cgcaccagga cggccaggac gaaccgtttt tcattaccga agagatcgag gcggagatga 6960
tcgcggccgg gtacgtgttc gagccgcccg cgcacgtctc aaccgtgcgg ctgcatgaaa 7020
tcctggccgg tttgtctgat gccaagctgg cggcctggcc ggccagcttg gccgctgaag 7080
aaaccgagcg ccgccgtcta aaaaggtgat gtgtatttga gtaaaacagc ttgcgtcatg 7140
cggtcgctgc gtatatgatg cgatgagtaa ataaacaaat acgcaagggg aacgcatgaa 7200
ggttatcgct gtacttaacc agaaaggcgg gtcaggcaag acgaccatcg caacccatct 7260
agcccgcgcc ctgcaactcg ccggggccga tgttctgtta gtcgattccg atccccaggg 7320
cagtgcccgc gattgggcgg ccgtgcggga agatcaaccg ctaaccgttg tcggcatcga 7380
ccgcccgacg attgaccgcg acgtgaaggc catcggccgg cgcgacttcg tagtgatcga 7440
cggagcgccc caggcggcgg acttggctgt gtccgcgatc aaggcagccg acttcgtgct 7500
gattccggtg cagccaagcc cttacgacat atgggccacc gccgacctgg tggagctggt 7560
taagcagcgc attgaggtca cggatggaag gctacaagcg gcctttgtcg tgtcgcgggc 7620
gatcaaaggc acgcgcatcg gcggtgaggt tgccgaggcg ctggccgggt acgagctgcc 7680
cattcttgag tcccgtatca cgcagcgcgt gagctaccca ggcactgccg ccgccggcac 7740
aaccgttctt gaatcagaac ccgagggcga cgctgcccgc gaggtccagg cgctggccgc 7800
tgaaattaaa tcaaaactca tttgagttaa tgaggtaaag agaaaatgag caaaagcaca 7860
aacacgctaa gtgccggccg tccgagcgca cgcagcagca aggctgcaac gttggccagc 7920
ctggcagaca cgccagccat gaagcgggtc aactttcagt tgccggcgga ggatcacacc 7980
aagctgaaga tgtacgcggt acgccaaggc aagaccatta ccgagctgct atctgaatac 8040
atcgcgcagc taccagagta aatgagcaaa tgaataaatg agtagatgaa ttttagcggc 8100
taaaggaggc ggcatggaaa atcaagaaca accaggcacc gacgccgtgg aatgccccat 8160
gtgtggagga acgggcggtt ggccaggcgt aagcggctgg gttgtctgcc ggccctgcaa 8220
tggcactgga acccccaagc ccgaggaatc ggcgtgacgg tcgcaaacca tccggcccgg 8280
tacaaatcgg cgcggcgctg ggtgatgacc tggtggagaa gttgaaggcc gcgcaggccg 8340
cccagcggca acgcatcgag gcagaagcac gccccggtga atcgtggcaa gcggccgctg 8400
atcgaatccg caaagaatcc cggcaaccgc cggcagccgg tgcgccgtcg attaggaagc 8460
cgcccaaggg cgacgagcaa ccagattttt tcgttccgat gctctatgac gtgggcaccc 8520
gcgatagtcg cagcatcatg gacgtggccg ttttccgtct gtcgaagcgt gaccgacgag 8580
ctggcgaggt gatccgctac gagcttccag acgggcacgt agaggtttcc gcagggccgg 8640
ccggcatggc cagtgtgtgg gattacgacc tggtactgat ggcggtttcc catctaaccg 8700
aatccatgaa ccgataccgg gaagggaagg gagacaagcc cggccgcgtg ttccgtccac 8760
acgttgcgga cgtactcaag ttctgccggc gagccgatgg cggaaagcag aaagacgacc 8820
tggtagaaac ctgcattcgg ttaaacacca cgcacgttgc catgcagcgt acgaagaagg 8880
ccaagaacgg ccgcctggtg acggtatccg agggtgaagc cttgattagc cgctacaaga 8940
tcgtaaagag cgaaaccggg cggccggagt acatcgagat cgagctagct gattggatgt 9000
accgcgagat cacagaaggc aagaacccgg acgtgctgac ggttcacccc gattactttt 9060
tgatcgatcc cggcatcggc cgttttctct accgcctggc acgccgcgcc gcaggcaagg 9120
cagaagccag atggttgttc aagacgatct acgaacgcag tggcagcgcc ggagagttca 9180
agaagttctg tttcaccgtg cgcaagctga tcgggtcaaa tgacctgccg gagtacgatt 9240
tgaaggagga ggcggggcag gctggcccga tcctagtcat gcgctaccgc aacctgatcg 9300
agggcgaagc atccgccggt tcctaatgta cggagcagat gctagggcaa attgccctag 9360
caggggaaaa aggtcgaaaa gctgtctttc ctgtggatag cacgtacatt gggaacccaa 9420
agccgtacat tgggaaccgg aacccgtaca ttgggaaccc aaagccgtac attgggaacc 9480
ggtcacacat gtaagtgact gatataaaag agaaaaaagg cgatttttcc gcctaaaact 9540
ctttaaaact tattaaaact cttaaaaccc gcctggcctg tgcataactg tctggccagc 9600
gcacagccga agagctgcaa aaagcgccta cccttcggtc gctgcgctcc ctacgccccg 9660
ccgcttcgcg tcggcctatc gcggccgctg gccgctcaaa aatggctggc ctacggccag 9720
gcaatctacc agggcgcgga caagccgcgc cgtcgccact cgaccgccgg cgcccacatc 9780
aaggcaccct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc 9840
ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc 9900
gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc 9960
ggagtgtata ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 10020
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg 10080
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 10140
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 10200
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 10260
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 10320
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 10380
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 10440
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 10500
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 10560
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 10620
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 10680
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 10740
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 10800
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 10860
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatgc 10920
attctaggta ctaaaacaat tcatccagta aaatataata ttttattttc tcccaatcag 10980
gcttgatccc cagtaagtca aaaaatagct cgacatactg ttcttccccg atatcctccc 11040
tgatcgaccg gacgcagaag gcaatgtcat accacttgtc cgccctgccg cttctcccaa 11100
gatcaataaa gccacttact ttgccatctt tcacaaagat gttgctgtct cccaggtcgc 11160
cgtgggaaaa gacaagttcc tcttcgggct tttccgtctt taaaaaatca tacagctcgc 11220
gcggatcttt aaatggagtg tcttcttccc agttttcgca atccacatcg gccagatcgt 11280
tattcagtaa gtaatccaat tcggctaagc ggctgtctaa gctattcgta tagggacaat 11340
ccgatatgtc gatggagtga aagagcctga tgcactccgc atacagctcg ataatctttt 11400
cagggctttg ttcatcttca tactcttccg agcaaaggac gccatcggcc tcactcatga 11460
gcagattgct ccagccatca tgccgttcaa agtgcaggac ctttggaaca ggcagctttc 11520
cttccagcca tagcatcatg tccttttccc gttccacatc ataggtggtc cctttatacc 11580
ggctgtccgt catttttaaa tataggtttt cattttctcc caccagctta tataccttag 11640
caggagacat tccttccgta tcttttacgc agcggtattt ttcgatcagt tttttcaatt 11700
ccggtgatat tctcatttta gccatttatt atttccttcc tcttttctac agtatttaaa 11760
gataccccaa gaagctaatt ataacaagac gaactccaat tcactgttcc ttgcattcta 11820
aaaccttaaa taccagaaaa cagctttttc aaagttgttt tcaaagttgg cgtataacat 11880
agtatcgacg gagccgattt tgaaaccgcg gtgatcacag gcagcaacgc tctgtcatcg 11940
ttacaatcaa catgctaccc tccgcgagat catccgtgtt tcaaacccgg cagcttagtt 12000
gccgttcttc cgaatagcat cggtaacatg agcaaagtct gccgccttac aacggctctc 12060
ccgctgacgc cgtcccggac tgatgggctg cctgtatcga gtggtgattt tgtgccgagc 12120
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 12180
acgcttagac aacttaataa cacattgcgg acgtttttaa tgtactgaat taacgccgaa 12240
ttaattcggg ggatctggat tttagtactg gattttggtt ttaggaatta gaaattttat 12300
tgatagaagt attttacaaa tacaaataca tactaagggt ttcttatatg ctcaacacat 12360
gagcgaaacc ctataggaac cctaattccc ttatctggga actactcaca cattattatg 12420
gagaaactcg agcttgtcga tcgacagatc cggtcggcat ctactctatt tctttgccct 12480
cggacgagtg ctggggcgtc ggtttccact atcggcgagt acttctacac agccatcggt 12540
ccagacggcc gcgcttctgc gggcgatttg tgtacgcccg acagtcccgg ctccggatcg 12600
gacgattgcg tcgcatcgac cctgcgccca agctgcatca tcgaaattgc cgtcaaccaa 12660
gctctgatag agttggtcaa gaccaatgcg gagcatatac gcccggagtc gtggcgatcc 12720
tgcaagctcc ggatgcctcc gctcgaagta gcgcgtctgc tgctccatac aagccaacca 12780
cggcctccag aagaagatgt tggcgacctc gtattgggaa tccccgaaca tcgcctcgct 12840
ccagtcaatg accgctgtta tgcggccatt gtccgtcagg acattgttgg agccgaaatc 12900
cgcgtgcacg aggtgccgga cttcggggca gtcctcggcc caaagcatca gctcatcgag 12960
agcctgcgcg acggacgcac tgacggtgtc gtccatcaca gtttgccagt gatacacatg 13020
gggatcagca atcgcgcata tgaaatcacg ccatgtagtg tattgaccga ttccttgcgg 13080
tccgaatggg ccgaacccgc tcgtctggct aagatcggcc gcagcgatcg catccatagc 13140
ctccgcgacc ggttgtagaa cagcgggcag ttcggtttca ggcaggtctt gcaacgtgac 13200
accctgtgca cggcgggaga tgcaataggt caggctctcg ctaaactccc caatgtcaag 13260
cacttccgga atcgggagcg cggccgatgc aaagtgccga taaacataac gatctttgta 13320
gaaaccatcg gcgcagctat ttacccgcag gacatatcca cgccctccta catcgaagct 13380
gaaagcacga gattcttcgc cctccgagag ctgcatcagg tcggagacgc tgtcgaactt 13440
ttcgatcaga aacttctcga cagacgtcgc ggtgagttca ggctttttca tatctcattg 13500
ccccccggga tctgcgaaag ctcgagagag atagatttgt agagagagac tggtgatttc 13560
agcgtgtcct ctccaaatga aatgaacttc cttatataga ggaaggtctt gcgaaggata 13620
gtgggattgt gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga 13680
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt 13740
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca 13800
tttgtaggtg ccaccttcct tttctactgt ccttttgatg aagtgacaga tagctgggca 13860
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa tagccctttg 13920
gtcttctgag actgtatctt tgatattctt ggagtagacg agagtgtcgt gctccaccat 13980
gttatcacat caatccactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 14040
gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 14100
agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 14160
tttgatgaag tgacagatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 14220
ttgttgaaaa gtctcaatag ccctttggtc ttctgagact gtatctttga tattcttgga 14280
gtagacgaga gtgtcgtgct ccaccatgtt ggcaagctgc tctagccaat acgcaaaccg 14340
cctctccccg cgcgttggcc gat 14363

Claims (10)

1.一种用于水稻基因编辑的CasΦ-2蛋白,其特征在于,在所述CasΦ-2蛋白的氨基酸序列的N端增加1个核定位信号肽氨基酸序列,在C端增加3个核定位信号肽氨基酸序列。
2.根据权利要求1所述的用于水稻基因编辑的CasΦ-2蛋白,其特征在于,在所述CasΦ-2蛋白的氨基酸序列的N端增加的核定位信号肽氨基酸序列为SV40核定位信号肽氨基酸序列,在C端增加的3个核定位信号肽氨基酸序列依次为2个SV40核定位信号肽氨基酸序列和1个NLS核定位信号肽氨基酸序列。
3.根据权利要求2所述的用于水稻基因编辑的CasΦ-2蛋白,其特征在于,所述CasΦ-2蛋白的氨基酸序列如SEQ ID NO.1所示,所述CasΦ-2蛋白的核苷酸序列如SEQ ID NO.2所示。
4.一种用于水稻基因编辑的CasΦ-2蛋白表达载体,其特征在于,在空白载体上含有权利要求1-3任一项所述的CasΦ-2蛋白的核苷酸序列。
5.根据权利要求4所述的CasΦ-2蛋白表达载体,其特征在于,所用的所述空白载体为pCAMBIA1300载体,转录CasΦ-2蛋白的核苷酸使用玉米UBI启动子和NOS终止子;
所述玉米UBI启动子的核苷酸序列如SEQ ID NO.3所示,所述NOS终止子的核苷酸序列如SEQ ID NO.4所示。
6.一种用于水稻基因编辑的CasΦ-2蛋白的CrRNA表达盒子,其特征在于,包括CrRNA表达盒空载和针对相应的水稻基因设计的基因编辑靶点;
所述CrRNA表达盒空载包括权利要求1-3任一项所述的CasΦ-2蛋白的CrRNA,还包括针对转录相应的水稻基因编辑靶点的启动子,并且所述CrRNA的核苷酸序列的两端分别设有1个tRNA序列。
7.根据权利要求6所述的CasΦ-2蛋白的CrRNA表达盒子,其特征在于,所述水稻基因为OsBEL基因,所述基因编辑靶点的核苷酸序列如SEQ ID NO.5所示,启动所述水稻基因OsBEL靶点的OsU6a启动子的核苷酸序列如SEQ ID NO.6所示;所述CasΦ-2蛋白的CrRNA的核苷酸序列如SEQ ID NO.7所示;所述tRNA序列的核苷序列如SEQ ID NO.8所示;所述CrRNA表达盒空载的核苷序列如SEQ ID NO.9所示;
组装所述的CasΦ-2蛋白的CrRNA表达盒子所用的引物为:
BEL-F:ggacCATCTCCTTCTAGAAGCACA;
BEL-R:tgttTGTGCTTCTAGAAGGAGATG;
组装的具体方式为:取引物1μl BEL-F、1μl BEL-R、8μl无菌水,先在95℃变性,再在55℃退火后,得到BEL引物混合液;再取1μl BEL引物混合液,与30ng CrRNA表达盒空载、1μl10×CutSmart Buffer、35U T4 DNA连接酶、10U Bsal限制性内切酶和无菌水组成10μl混合体系,37℃培养1h,制得所述CasΦ-2蛋白的CrRNA表达盒子OsU6a-CrRNA-BEL。
8.一种用于水稻基因编辑的CasΦ-2蛋白完整表达载体,其特征在于,所述CasΦ-2蛋白完整表达载体上连接有权利要求4或5所述的CasΦ-2蛋白表达载体,还连接有权利要求6或7所述的CasΦ-2蛋白的CrRNA表达盒子。
9.根据权利要求8所述的CasΦ-2蛋白完整表达载体,其特征在于,是先使用引物Pps-R和Pgs-L对CasΦ-2蛋白的CrRNA表达盒子进行扩增,再用BsaI和T4 DNA连接酶与所述CasΦ-2蛋白表达载体组装连接后构成;
所述引物Pps-R和Pgs-L为:
Pps-R:TAGAggtctcTaccgACTAGTATGGAATCGGCAGCAAAGG;
Pgs-L:AGTGggtctcGctcgACGCGTATCCATCCACTCCAAGCTC。
10.根据权利要求9所述的CasΦ-2蛋白完整表达载体,其特征在于,其核苷酸序列如SEQ ID NO.10所示。
CN202111062804.0A 2021-09-10 2021-09-10 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体 Pending CN113717962A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111062804.0A CN113717962A (zh) 2021-09-10 2021-09-10 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111062804.0A CN113717962A (zh) 2021-09-10 2021-09-10 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体

Publications (1)

Publication Number Publication Date
CN113717962A true CN113717962A (zh) 2021-11-30

Family

ID=78683211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111062804.0A Pending CN113717962A (zh) 2021-09-10 2021-09-10 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体

Country Status (1)

Country Link
CN (1) CN113717962A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114438056A (zh) * 2022-03-03 2022-05-06 吉林省农业科学院 CasF2蛋白、CRISPR/Cas基因编辑系统及其在植物基因编辑中的应用
CN115992115A (zh) * 2021-10-26 2023-04-21 山东舜丰生物科技有限公司 新型的crispr酶和系统以及应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107304435A (zh) * 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 一种Cas9/RNA系统及其应用
CN108130342A (zh) * 2016-12-01 2018-06-08 中国科学院上海生命科学研究院 基于Cpf1的植物基因组定点编辑方法
CN111770992A (zh) * 2018-11-15 2020-10-13 中国农业大学 CRISPR-Cas12j酶和系统
US20210254038A1 (en) * 2019-03-07 2021-08-19 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
CN113308451A (zh) * 2020-12-07 2021-08-27 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107304435A (zh) * 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 一种Cas9/RNA系统及其应用
CN108130342A (zh) * 2016-12-01 2018-06-08 中国科学院上海生命科学研究院 基于Cpf1的植物基因组定点编辑方法
CN111770992A (zh) * 2018-11-15 2020-10-13 中国农业大学 CRISPR-Cas12j酶和系统
US20210254038A1 (en) * 2019-03-07 2021-08-19 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
CN113308451A (zh) * 2020-12-07 2021-08-27 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAGGIO, I.等: "Integrating gene delivery and gene-editing technologies by adenoviral vector transfer of optimized CRISPR-Cas9 components", GENE THER., vol. 27, no. 5, pages 219 - 220 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115992115A (zh) * 2021-10-26 2023-04-21 山东舜丰生物科技有限公司 新型的crispr酶和系统以及应用
CN115992115B (zh) * 2021-10-26 2023-09-01 山东舜丰生物科技有限公司 新型的crispr酶和系统以及应用
CN114438056A (zh) * 2022-03-03 2022-05-06 吉林省农业科学院 CasF2蛋白、CRISPR/Cas基因编辑系统及其在植物基因编辑中的应用
CN114438056B (zh) * 2022-03-03 2023-11-21 吉林省农业科学院 CasF2蛋白、CRISPR/Cas基因编辑系统及其在植物基因编辑中的应用

Similar Documents

Publication Publication Date Title
CN107090466B (zh) 双sgRNA表达质粒及其文库的构建方法
CN113631704A (zh) 可用于基因编辑的多肽及使用方法
CN113717962A (zh) 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体
US6391586B1 (en) Nucleic acid molecules encoding a secreted neural adhesion protein
CN111471674A (zh) 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
CN113754781B (zh) 基于mRNA的针对冠状病毒的疫苗及其制备方法
KR20210010484A (ko) 재조합 단백질의 개선된 분비를 위한 sec 변형 균주
KR101535555B1 (ko) 구제역 바이러스 O Manisa를 이용한 재조합 구제역 백신 바이러스
CN110669775B (zh) 差异代理技术在a·g碱基替换细胞富集中的应用
WO2011110864A1 (en) Promoter sequence for dna and viral vectors
CN108218997B (zh) 一种用于纯化蛋白的表达载体
KR102076338B1 (ko) 잠두위조바이러스2를 이용한 고추 유전자 침묵 기술
KR102269272B1 (ko) 장기면역 강화 유전자가 삽입된 구제역 a형 방어항원이 발현되는 재조합 바이러스 및 이를 포함하는 백신조성물
US20030157495A1 (en) Nucleic acid molecules encoding CEL I endonuclease and methods of use thereof
KR102009268B1 (ko) 구제역 C3 Resende 주의 방어 항원이 발현되는 재조합 바이러스
CN111801422B (zh) 基于乳酸克鲁维酵母产生保护性单价和多价亚单位疫苗的优化的宿主/载体系统
CN114773441B (zh) Hot1p作为正调控因子在提高宿主细胞中蛋白表达中的应用
CN114657197B (zh) Gsm1p作为正调控因子在提高宿主细胞中蛋白表达中的应用
KR101488110B1 (ko) 나노아케움 이퀴탄스 유래의 Neq HS DNA 중합효소의 돌연변이체 제조 및 이를 이용한 hot-start PCR 응용
CN111304239B (zh) 一种滚环复制重组载体、构建方法及应用
CN112410344B (zh) 一种对PRRSV具有特异性免疫刺激作用的CpG-ODN及其应用
KR101578425B1 (ko) 구제역 sat1형 wz 지역형의 방어항원이 발현되는 재조합 바이러스 및 그의 제조방법
KR101122955B1 (ko) 콩 모자이크 바이러스의 감염성 클론을 이용한 식물체내에서의 외래 유전자 과발현 방법
CN112111516A (zh) 一种用于腺病毒载体构建的携带双顺反子的穿梭质粒及构建
KR101891607B1 (ko) 구제역 Asia1 형의 아시아 발생주 및 백신 표준주 Shamir의 방어항원이 동시 발현되는 안정한 재조합 바이러스

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination