CN110527695B - 一种用于基因定点突变的核酸构建物 - Google Patents

一种用于基因定点突变的核酸构建物 Download PDF

Info

Publication number
CN110527695B
CN110527695B CN201910839046.5A CN201910839046A CN110527695B CN 110527695 B CN110527695 B CN 110527695B CN 201910839046 A CN201910839046 A CN 201910839046A CN 110527695 B CN110527695 B CN 110527695B
Authority
CN
China
Prior art keywords
leu
lys
glu
arg
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910839046.5A
Other languages
English (en)
Other versions
CN110527695A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shunfeng Biotechnology Co Ltd
Original Assignee
Shandong Shunfeng Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shunfeng Biotechnology Co Ltd filed Critical Shandong Shunfeng Biotechnology Co Ltd
Publication of CN110527695A publication Critical patent/CN110527695A/zh
Priority to PCT/CN2020/078079 priority Critical patent/WO2020177751A1/zh
Application granted granted Critical
Publication of CN110527695B publication Critical patent/CN110527695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明提供了一种用于基因定点突变的核酸构建物,具体地,本发明涉及一种核酸构建物,本发明采用特定结构的核酸构建物,首次在植物中成功实现了sgRNA引导的高效的碱基定点突变(如C突变为T或由G突变为A)。

Description

一种用于基因定点突变的核酸构建物
技术领域
本发明涉及生物技术领域,具体地,涉及一种用于基因定点突变的核酸构建物。
背景技术
植物中许多性状的差异由一个或几个DNA碱基的变异造成,突变某些特定碱基可增强、减弱或抑制其某个性状的表达。CRISPR-Cas9基因编辑技术已经广泛应用于动植物基因编辑的研究中,目前主要包括胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE),碱基编辑器能够在基因组中进行精确的碱基替换,且不会造成DNA双链断裂(DSB)。早期开发的CBE和ABE系统,分别由大鼠胞苷脱氨酶APOBEC1来源于七鳃鳗的胞苷脱氨酶PmCDA1和由tRNA腺嘌呤脱氨酶进化来的TadA组成,已应用于许多植物物种中,如水稻,小麦,玉米,番茄,拟南芥和甘蓝型油菜。为了进一步提高植物的碱基编辑效率,Kang等人对启动子进行了优化,Zong等人对脱氨酶进行了优化。另一方面,为了扩大基因编辑范围,Qin等和Hua等人利用了不同于SpCas9的其它Cas9蛋白,这些Cas9蛋白的变体可识别与经典NGG基序不一样的PAM序列。然而,相对于目前广泛使用的基因敲除技术,单碱基编辑的效率仍然很低。此外,至今报道的碱基编辑器仅能识别有限的几种PAM序列,使得植物基因组中可编辑的范围受到很大的限制。
因此,本领域迫切需要开发一种在植物细胞中可高效、可在较大范围内且精确地实现C-T转化同时显著降低插入或缺失突变风险的新的用于基因编辑的核酸构建物。
发明内容
本发明的目的在于提供一种在植物细胞中可高效、可在较大范围且精确地实现C-T转化同时显著降低插入或缺失突变风险的新的用于基因编辑的核酸构建物。
本发明第一方面提供一种核酸构建物,所述核酸构建物具有5’-3’(5’至3’)的式I结构:
I1-Z1-Z2-I2 (I)
式中,
I1为第一整合元件;
I2为第二整合元件;
Z1为第一表达盒;
Z2为第二表达盒;
并且,Z1和Z2中的一个表达盒具有Ia结构,而另一个表达盒具有式Ib结构:
P1-S1-X1-L1-X2-X4-L2-X3 (Ia)
P2-Y1(Ib);
式中,
P1、S1、X1、L1、X2、X4、L2、X3、P2、Y1分别为用于构成所述构建物的元件;
P1为第一启动子,所述第一启动子为RNA聚合酶II依赖的启动子;
S1为第一核定位信号的编码序列;
X1为胞嘧啶脱氨酶的编码序列;
L1为无或第一连接肽的编码序列;
X2为Cas9核酸酶的编码序列,所述的Cas9核酸酶是无切割活性或单链切割活性的;
X4为尿嘧啶糖苷酶抑制剂UGI的编码序列;
L2为无或第二连接肽的编码序列;
X3为第二核定位信号的编码序列;
P2为第二启动子;
Y1为sgRNA的编码序列;
并且,各“-”为键或核苷酸连接序列。
在另一优选例中,所述第一启动子来源于选自下组的一种或多种植物:玉米、水稻、大豆、拟南芥或番茄。
在另一优选例中,所述第一启动子来源于选自下组的一种或多种微生物:链霉菌、大肠杆菌。
在另一优选例中,所述第一启动子来源于选自下组的一种或多种病毒:烟草花叶病毒、黄叶卷曲病毒、花椰菜花叶病毒、棉花曲叶病毒。
在另一优选例中,所述第一启动子包括玉米泛素启动子。
在另一优选例中,所述泛素启动子包括UBI启动子。
在另一优选例中,所述第一启动子选自下组:UBI、UBQ、35S、Actin、SPL,CmYLCV、YAO、CDC45、rbcS、rbcL、PsGNS2、UEP1、TobRB7、Cab、或其组合。
在另一优选例中,所述的L1和L2的核苷酸序列长度各自独立地为3-120nt,较佳的为3-96nt,并且优选为3的倍数。
在另一优选例中,所述的L1和L2编码的氨基酸序列长度各自独立的为3-40aa,较佳的为6-32aa,较佳的为18-32aa,较佳的为24-32aa。
在另一优选例中,所述的核苷酸连接序列长度为1-300nt,较佳地1-100nt。
在另一优选例中,所述核苷酸连接序列不影响各元件的正常转录和翻译。
在另一优选例中,所述Cas9核酸酶选自下组:Cas9n、Cas9NG、或其组合。
在另一优选例中,所述Cas9核酸酶选自下组:SpCas9n(D10A)、nSpCas9NG、SaCas9n、ScCas9n、SqCas9n、XCas9n、或其组合。
在另一优选例中,所述Cas9核酸酶包括突变的Cas9核酸酶。
在另一优选例中,所述的Cas9核酸酶与所述的突变的Cas9核酸酶的相同性≥80%,较佳地≥90%;更佳地≥95%,更佳地,≥98%或99%。
在另一优选例中,所述的突变Cas9核酸酶与野生型Cas9酶的活性相当或显著优于野生型Cas9酶的活性。
在另一优选例中,所述突变的Cas9核酸酶由所述的野生型的Cas9核酸酶经过一个或多个,较佳地1-15个,较佳地1-10个,较佳的1-7个,更佳地2-5个,氨基酸取代、缺失;和/或
经过1-5,较佳地1-4个,更佳地1-3个,最佳地1-2个氨基酸的添加形成的。
在另一优选例中,所述X2元件中,突变位点在Cas9核酸酶(SEQ ID NO.:2)的D10A位:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENI IHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO.:2)。
在另一优选例中,所述X2元件在Cas9核酸酶的对应于SEQ ID NO.:2的选自下组的一个或多个位点发生突变:
第1335位精氨酸(R);
第1111位亮氨酸(L);
第1135位天冬氨酸(D);
第1218位甘氨酸(G);
第1219位谷氨酸(E);
第1322位的丙氨酸(A);
第1337位的苏氨酸(T)。
在另一优选例中,所述第1335位精氨酸(R)突变为丙氨酸(A);和/或
第1111位亮氨酸(L)突变为精氨酸(R);和/或
第1135位天冬氨酸(D)突变为缬氨酸(V);和/或
第1218位甘氨酸(G)突变为精氨酸(R);和/或
第1219位谷氨酸(E)突变为苯丙氨酸(F);和/或
第1322位的丙氨酸(A)突变为精氨酸(R);和/或
第1337位的苏氨酸(T)突变为精氨酸(R)。
在另一优选例中,所述突变选自下组:R1335A;L1111R;D1135V;G1218R;E1219F;A1322R;T1337R。
在另一优选例中,所述X2元件的氨基酸序列如SEQ ID NO.:3所示:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESIRPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENI IHLFTLTNLGAPRAFKYFDTTIDRKVYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO.:3)。
在另一优选例中,所述X2元件来源于细菌。
在另一优选例中,所述X2元件的来源选自下组:酿脓链球菌(Streptococcuspyogenes)、葡萄球菌(Staphylococcus aureus)、犬链球菌(Streptococcus canis)、或其组合。
在另一优选例中,所述第一连接肽的编码序列、第二连接肽的编码序列各自独立地包括XTEN。
在另一优选例中,所述第一连接肽的编码序列、第二连接肽的编码序列如SEQ IDNO.:4或7所示。
在另一优选例中,所述核定位信号为密码子优化的核定位信号。
在另一优选例中,所述核定位信号为植物密码子优化的核定位信号。
在另一优选例中,所述核定位信号包括bpNLS。
在另一优选例中,所述核定位信号为bpNLS。
在另一优选例中,所述S1元件的核苷酸序列如SEQ ID NO.:5所示。
在另一优选例中,所示X3元件的核苷酸序列如SEQ ID NO.:31所示。
在另一优选例中,所述胞嘧啶脱氨酶包括野生型和突变型。
在另一优选例中,所述胞嘧啶脱氨酶包括APOBEC。
在另一优选例中,所述APOBEC选自下组:APOBEC1(A1)、APOBEC2(A2)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3E、APOBEC3F、APOBEC3H、APOBEC4(A4)、活化诱导脱氨酶(activation induced cytidine deaminase,AID)、或其组合。
在另一优选例中,所述胞嘧啶脱氨酶的突变型包括CBE2.0、CBE2.1、CBE2.2、CBE2.3、CBE2.4。
在另一优选例中,所述胞嘧啶脱氨酶为密码子优化的胞嘧啶脱氨酶。
在另一优选例中,所述胞嘧啶脱氨酶为植物密码子优化的胞嘧啶脱氨酶。
在另一优选例中,所述胞嘧啶脱氨酶的编码序列选自下组:
(i)序列如SEQ ID NO.:1所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:1所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:1所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述胞嘧啶脱氨酶的编码序列如SEQ ID NO.1所示。
在另一优选例中,所述胞嘧啶脱氨酶的氨基酸序列如SEQ ID NO.:8所示。
在另一优选例中,所述X4元件的核苷酸序列如SEQ ID NO.:9所示。
在另一优选例中,所述第二启动子来源于选自下组的一种或多种植物:水稻、玉米、大豆、拟南芥或番茄。
在另一优选例中,所述第二启动子来源于选自下组的一种或多种微生物:链霉菌、大肠杆菌。
在另一优选例中,所述第二启动子来源于选自下组的一种或多种病毒:烟草花叶病毒、黄叶卷曲病毒、花椰菜花叶病毒、棉花曲叶病毒。
在另一优选例中,所述第二启动子包括RNA聚合酶III依赖的启动子。
在另一优选例中,所述第二启动子为RNA聚合酶III依赖的启动子。
在另一优选例中,所述第二启动子选自下组:U6、U3、U6a、U6b、U6c、U6-1、U3b、U3d、U6-26、U6-29、H1、或其组合。
在另一优选例中,所述第二启动子包括U6启动子。
在另一优选例中,所述第二启动子选自下组:OsU6、OsU3、OsU6a、OsU6b、OsU6c、AtU6-1、AtU3b、AtU3d、AtU6-1、AtU6-26、AtU6-29、或其组合。
在另一优选例中,所述的“无切割活性或单链切割活性”指Cas9核酸酶对于靶位点G所在的单链无切割活性。
在另一优选例中,本发明的上述核苷酸元件是按阅读框(in-frame)连接的,从而表达氨基酸序列正确的融合蛋白。
在另一优选例中,所述的构建物具有式IIa或式IIb结构:
I1-P1-S1-X1-L1-X2-X4-L2-X3-P2-Y1-I2 (IIa);
I1-P2-Y1-P1-S1-X1-L1-X2-X4-L2-X3-I2 (IIb);
式中,各元件的定义如上所述。
在另一优选例中,所述的第一表达盒和第二表达盒均具有终止子。
在另一优选例中,所述的第一表达盒和第二表达盒共用相同的终止子。
在另一优选例中,所述终止子包括适用于植物基因编辑的终止子。
在另一优选例中,所述终止子选自下组:NOS、Poly A、T-UBQ、rbcS、或其组合。
在另一优选例中,所述终止子的核苷酸序列如SEQ ID NO.:6所示。
在另一优选例中,所述第一整合元件包括5’同源臂序列。
在另一优选例中,所述第二整合元件包括3’同源臂序列。
在另一优选例中,所述核酸构建物的长度为3000-10000bp,较佳地,4000-8500bp,更佳地,4000-6000bp。
在另一优选例中,在所述的I1和I2元件之间,还含有额外插入的一个或多个额外的表达盒。
在另一优选例中,所述的额外表达盒是独立于所述的第一表达盒和第二表达盒的。
在另一优选例中,所述的额外表达盒表达选自下组的物质:
(a1)标记基因;
(a2)与Y1编码的sgRNA不同的一种或多种sgRNA。
在另一优选例中,所述标记基因包括抗性基因(如潮霉素抗性基因、除草剂抗性基因)、荧光基因、或其组合。
本发明第二方面提供了一种融合蛋白,所述的融合蛋白包括胞嘧啶脱氨酶和Cas9核酸酶,并且所述融合蛋白由本发明第一方面所述的核酸构建物编码。
本发明第三方面提供了一种载体,所述载体含有本发明第一方面所述的核酸构建物。
在另一优选例中,所述载体为植物表达载体。
在另一优选例中,所述的载体为可转染或转化植物细胞的表达载体。
在另一优选例中,所述的载体为农杆菌Ti载体。
在另一优选例中,所述的构建物整合到所述载体的T-DNA区。
在另一优选例中,所述载体是环状的或线性的。
本发明第四方面提供了一种基因工程细胞,所述细胞含有本发明第一方面所述的核酸构建物,或其基因组整合有一个或多个本发明第一方面所述的核酸构建物。
在另一优选例中,所述的细胞为植物细胞。
在另一优选例中,所述的植物选自下组:单子叶植物、双子叶植物、裸子植物、或其组合。
在另一优选例中,所述的植物选自下组:禾本科植物、豆科植物、十字花科植物、茄科、伞形科、或其组合。
在另一优选例中,所述的植物包括:拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草、番茄、白菜、油菜、菠菜、生菜、黄瓜、茼蒿、空心菜、芹菜、油麦菜、或其组合。
在另一优选例中,所述的基因工程细胞是用选自下组的方法将权利要求1所述的核酸构建物导入细胞的:农杆菌转化法、基因枪法、显微注射法、电击法、超声波法和聚乙二醇(PEG)介导法。
本发明第五方面提供了一种用于基因编辑的试剂组合,包括:
(i)第一核酸构建物,或含有所述第一核酸构建物的第一载体,所述第一核酸构建物具有从5’-3’的式Ia结构:
P1-S1-X1-L1-X2-X4-L2-X3 (Ia)
其中,
P1为第一启动子,所述第一启动子为RNA聚合酶II依赖的启动子;
S1为核定位信号的编码序列;
X1为胞嘧啶脱氨酶的编码序列;
L1为无或第一连接肽的编码序列;
X2为Cas9核酸酶的编码序列,所述的Cas9核酸酶是无切割活性或单链切割活性的;
X4为尿嘧啶糖苷酶抑制剂UGI的编码序列;
L2为无或第二连接肽的编码序列;
X3为核定位信号的编码序列;
并且,“-”为键或核苷酸连接序列;和
(ii)第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有从5’-3’的式Ib所示的结构:
P2-Y1 (Ib);
其中,P2为第二启动子;
Y1为sgRNA的编码序列;
并且,“-”为键或核苷酸连接序列。
在另一优选例中,所述第一载体和所述第二载体为不同的载体。
在另一优选例中,所述第一核酸构建物和所述第二核酸构建物位于不同的载体上。
在另一优选例中,所述第一载体和所述第二载体为相同的载体。
在另一优选例中,所述第一核酸构建物和所述第二核酸构建物位于相同的载体上。
本发明第六方面提供了一种试剂盒,所述试剂盒含有本发明第五方面所述的试剂组合。
在另一优选例中,所述试剂盒还含有标签或说明书。
本发明第七方面提供了一种对植物进行基因编辑的方法,包括步骤:
(i)提供待编辑植物;和
(ii)将本发明第一方面所述的核酸构建物、本发明第三方面所述的载体或本发明第五方面所述的试剂组合导入所述待编辑植物的植物细胞,从而在所述植物细胞内进行基因编辑。
在另一优选例中,所述导入为通过农杆菌导入。
在另一优选例中,所述导入为通过基因枪导入。
在另一优选例中,所述的基因编辑为定点碱基替换(或突变)。
在另一优选例中,所述定点替换(或突变)包括将C突变为T。
在另一优选例中,所述的植物包括任何可进行转化技术的高等植物类型,包括单子叶植物、双子叶植物和裸子植物。
在另一优选例中,所述的植物选自下组:禾本科植物、豆科植物、十字花科植物、茄科、伞形科、或其组合。
在另一优选例中,所述的植物包括:拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草、番茄、白菜、油菜、菠菜、生菜、黄瓜、茼蒿、空心菜、芹菜、油麦菜、或其组合。
本发明第八方面提供了一种制备经基因编辑的植物细胞的方法,包括步骤:
(i)将本发明第一方面所述的核酸构建物、本发明第三方面所述的载体或本发明第五方面所述的试剂组合转染植物细胞,使得所述植物细胞中的染色体发生定点替换(或突变),从而制得所述经基因编辑的植物细胞。
在另一优选例中,所述的转染采用农杆菌转化法或基因枪轰击法。
本发明第九方面提供了一种本发明第一方面所述的核酸构建物、本发明第二方面所述的融合蛋白、本发明第三方面所述的载体、本发明第四方面所述的基因工程细胞、本发明第五方面所述的试剂组合、本发明第六方面所述的试剂盒的用途,用于对植物进行基因编辑。
本发明第十方面提供了一种制备经基因编辑的植物的方法,包括步骤:
将本发明第八方面所述方法制备的所述经基因编辑的植物细胞再生为植物体,从而获得所述经基因编辑的植物。
本发明第十一方面提供了一种经基因编辑的植物,所述的植物是用本发明第十方面所述的方法制备的。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了CBE2.0-nCas9对水稻NRT1.1B基因靶标位点C替换为T的碱基编辑效率,横坐标代表sgRNA-PAM序列,纵坐标代表取代效率。
图2显示了水稻NRT1.1B基因突变型植株中纯合体与其他非纯合体的比率。
图3和图4显示了水稻SLR1基因突变型植株与野生型植株的性状差异.
图5显示了CBE2.0-nCas9对水稻SLR1基因靶标位点C替换为T的碱基编辑效率,横坐标代表sgRNA-PAM序列,纵坐标代表取代效率。
图6显示了水稻SLR1基因突变体中纯合体与其他非纯合体突变类型比率。
图7显示了CBE2.0-nCas9对水稻ALS基因靶标位点C替换为T的碱基编辑效率。
图8显示了水稻ALS基因的突变型植株中纯合体与其他非纯合体的比率。
图9显示了CBE2.0-nCas9NG对水稻ALS基因靶标位点C替换为T的碱基编辑效率。
图10显示了喷施咪唑乙烟酸除草剂的水稻ALS基因突变型植株与野生型植株的生长表型差异。
图11显示了水稻ALS基因突变型植株相对野生型植株的突变位点。
图12显示了水稻EPSPS基因的突变位点。
图13显示了CBE2.0-nCas9、CBE2.0-nCas9NG对不同靶基因的编辑效率。
具体实施方式
本发明人经过广泛而深入地研究,通过优化胞嘧啶碱基编辑器元件的质量和数量,采用双核定位信号、优化的胞嘧啶脱氨酶、不同的Cas9核酸酶,本发明首次构建了一种在植物基因编辑中更加高效、识别范围更宽的胞嘧啶碱基编辑工具,并首次在植物中成功实现了sgRNA引导的高效的碱基定点突变(如C突变为T),通过优化胞嘧啶脱氨酶,提高了突变效率(可高达≥80%或更高),通过优化Cas9蛋白可识别更多的PAM位点(包括NGG、NG),同时indel比例很低,<7%,提高了编辑的精确率。并在此基础上完成了本发明。
术语
如本文所用,术语“同源臂”指打靶载体上待插入的外源序列两侧的与基因组序列完全一致的侧翼序列,用于识别并发生重组的区域。
如本文所用,术语“植物启动子”指能够在植物细胞中启动核酸转录的核酸序列。该植物启动子可以是来源于植物、微生物(如细菌、病毒)或动物等,或者是人工合成或改造过的启动子。
如本文所用,术语“基因编辑”或“碱基突变”或“碱基编辑”指核苷酸序列的某一位置处发生碱基的替换(substitution)、插入(insertion)和/或缺失(deletion)。本发明中所述“编辑”或“突变”优选为单碱基突变。
如本文所用,术语“碱基替换”指核苷酸序列的某一位置处的碱基突变为另一不同的碱基,比如C突变为T。
如本文所用,术语“C.G到T.A”指在双链核酸序列(尤其是基因组序列)中,某一位置上的C-G碱基对突变为或替换为T-A碱基对。
如本文所用,术语“Cas蛋白”指一种核酸酶。一种优选的Cas蛋白是Cas9蛋白。典型的Cas9蛋白包括(但并不限于):来源于酿脓链球菌(Streptococcuspyogenes)的Cas9。在本发明中,Cas9蛋白为突变的Cas9蛋白,具体地,是无切割活性或只具有单链切割活性的突变的Cas9蛋白。在一优选实施方式中,本发明的Cas9蛋白包括SpCas9n(D10A)、nSpCas9NG、SaCas9n、ScCas9n、XCas9n。
如本文所用,术语“Cas蛋白的编码序列”指编码Cas蛋白的核苷酸序列。在插入的多聚核苷酸序列被转录和翻译从而产生功能性Cas蛋白的情况下,技术人员会认识到,因为密码子的简并性,有大量多聚核苷酸序列可以编码相同的多肽。另外,技术人员也会认识到不同物种对于密码子具有一定的偏好性,可能会根据在不同物种中表达的需要,会对Cas蛋白的密码子进行优化,这些变异体都被术语“Cas蛋白的编码序列”所具体涵盖。此外,术语特定地包括了全长的、与Cas基因序列基本相同的序列,以及编码出保留Cas蛋白功能的蛋白质的序列。
在本发明中,核苷酸序列的描述是从5’至3’方向,除非特别注明。
胞嘧啶脱氨酶
如本文所用,术语“胞嘧啶脱氨酶”指胞嘧啶脱氨酶APOBEC,来源于大肠杆菌,原本作用于tRNA,能够对tRNA中的特定胞嘧啶进行脱氨反应。
在本发明中,适用的胞嘧啶脱氨酶既包含野生型的形式也包含其特定的突变形式(如CBE2.0、CBE2.1、CBE2.2、CBE2.3、CBE2.4),也可包含野生型的形式和突变形式的组合。突变形式的胞嘧啶脱氨酶能够以DNA作为底物进行脱氨反应。
在另一优选例中,本发明的胞嘧啶脱氨酶的编码序列是对密码子进行优化的,从而能够更高效地在植物中表达。
在本发明的一个优选的实施方式中,优选的的胞嘧啶脱氨酶为CBE2.0。
在本发明中,CBE2.0的氨基酸序列如SEQ ID NO.:10所示:SSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEIKWGTSHKIWRHSSKNTTKHVEVNFIEKFTSERHFCPSTSCSITWFLSWSPCGECSKAITEFLSQHPNVTLVIYVARLYHHMDQQNRQGLRDLVNSGVTIQIMTAPEYDYCWRNFVNYPPGKEAHWPRYPPLWMKLYALELHAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO.:10)
CBE2.1的氨基酸序列如SEQ ID NO.:11所示:
SSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKEACLLYEIKWGTSHKIWRNSGKNTTKHVEVNFIEKFTSERHFCPSISCSITWFLSWSPCWECSKAIREFLSQHPNVTLVIYVARLFQHMDQQNRQGLRDLVNSGVTIQIMTASEYDHCWRNFVNYPPGKEAHWPRYPPLWMKLYALELHAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO.:11)
CBE2.2的氨基酸序列如SEQ ID NO.:12所示:
SSETGPVAVDPTLRRRIEPEFFNRNYDPRELRKETYLLYEIKWGKESKIWRHTSNNRTQHAEVNFLENFFNELYFNPSTHCSITWFLSWSPCGECSKAIVEFLKEHPNVNLEIYVARLYLCEDERNRQGLRDLVNSGVTIRIMNLPDYNY(SEQ ID NO.:12)
CBE2.3的氨基酸序列如SEQ ID NO.:13所示:
SSETGPVAVDPTLRRRIEPFYFQFNNDPRACRRKTYLCYELKQDGSTWVWKRTLHNKGRHAEICFLEKISSLEKLDPAQHYRITWYMSWSPCSNCAQKIVDFLKEHPHVNLRIYVARLYYHEEERYQEGLRNLRRSGVSIRVMDLPDFEHCWETFVDNGGGPFQPWPGLEELNSKQLSRRLQAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO.:13)
CBE2.4的氨基酸序列如SEQ ID NO.:14所示:
SSETGPVAVDPTLRRRIEPFHFQFNNDPRAYRRKTYLCYELKQDGSTWVLDRTLRNKGRHAEICFLDKINSWERLDPAQHYRVTWYMSWSPCSNCAQQVVDFLKEHPHVNLRIFAARLYYHEQRRYQEGLRSLRGSGVPVAVMTLPDFEHCWETFVDHGGRPFQPWDGLEELNSRSLSRRLQAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO.:14)
本发明的构建物
本发明提供了一种核酸构建物,用于对植物进行基因编辑,所述的核酸构建物具有5’-3’的式I结构:
I1-Z1-Z2-I2 (I)
式中,
I1为第一整合元件;
I2为第二整合元件;
Z1为第一表达盒;
Z2为第二表达盒;
并且,Z1和Z2中的一个表达盒具有Ia结构,而另一个表达盒具有式Ib结构:
P1-S1-X1-L1-X2-X4-L2-X3 (Ia)
P2-Y1(Ib);
I1、P1、S1、X1、L1、X2、X4、L2、X3、P2、Y1、I2分别为用于构成所述构建物的元件,其定义如本发明第一方面所述;
并且,各“-”为键或核苷酸连接序列。
在上述式I结构中,I1元件(或左侧整合元件)和I2元件(或右侧整合元件)可协同作用,从而将位于其间的元件(即从P1至Y1的核苷酸序列)整合到植物细胞的基因组中。
代表性的I1和I2是来自于农杆菌的Ti元件。当然,其他可起到类似整合作用的元件也可用于本发明。
本发明的构建物中所用的各种元件或者是本领域中已知的,或者可用本领域技术人员已知的方法制备。例如,可通过常规方法,如PCR方法、全人工化学合成法、酶切方法获得相应的元件,然后通过熟知的DNA连接技术连接在一起,就形成了本发明的构建物。
将本发明的构建物插入外源载体(尤其是适合转基因植物操作的载体),就构成了本发明的载体。
将本发明的载体转化植物细胞从而介导本发明的载体对植物细胞染色体进行整合,并在植物体内表达,制得经基因编辑的植物细胞。
将本发明的经基因编辑的植物细胞再生为植物体,从而获得经基因编辑的植物。
将本发明构建好的上述核酸构建物,通过常规的植物重组技术(例如农杆菌转让技术),可以导入植物细胞,从而获得携带所述核酸构建物(或带有所述核酸构建物的载体)的植物细胞,或获得基因组中整合有所述核酸构建物的植物细胞。
本发明中整合有所述核酸构建物的植物个体,在其子代可通过常规筛选或采用本领域已知的其他手段进行分离或去除,从而制得经基因编辑且不含有核酸构建物的植物体。
具体地,本发明是将一种优化过的胞嘧啶脱氨酶表达盒构建于植物的CRISPR/Cas9系统中,胞嘧啶脱氨酶可将靶DNA中的胞嘧啶(C)脱氨基转变为尿嘧啶(U),尿嘧啶在DNA复制过程中会被识别成T,实现C到T的突变。
核酸构建物的基本结构如下:
1、原有的CBE系统中,脱氨酶表达盒为ZmUbi-rAPOBEC1-XTEN-nCas9-UGI-SV40NLS-NOS
一级优化后:(注意:OsU6-sgRNA是sgRNA表达盒,在不同载体上是通用的)
OsU6-sgRNA-ZmUbi-bpNLS-CBE2.0-linker-nCas9-UGI-bpNLS-NOS
二级优化后:
CBE2.0-nCas9NG:
OsU6-sgRNA-ZmUbi-bpNLS-CBE2.0-linker-nCas9NG-UGI-bpNLS-NOS
Figure BDA0002193112120000151
Figure BDA0002193112120000161
载体构建
该载体的主要特征是将胞嘧啶脱氨基酶与CRISPR/Cas系统中的Cas蛋白、UGI以及核定位信号bpNLS的编码序列连接在一起,从而形成融合蛋白的编码序列。当该编码序列所编码的融合蛋白在细胞质中表达后,所述的融合蛋白可以非常高效地被转移至细胞核内,并由式I构建物所编码的guide RNA引导至基因组中的靶点位置,从而在靶点位置进行C.G到T.A的碱基替换,并基本上避免或消除了发生插入/缺失的风险。
由于胞嘧啶脱氨基酶直接将C突变为T,并不需要Cas蛋白的DNA双链切割活性。因此,在本发明中Cas蛋白是无切割活性或具有单链切割活性的突变的Cas蛋白。在一优选实施方式中,本发明的Cas蛋白可以是Cas9(D10A),其氨基酸序列如SEQ ID NO.:2所示。在一优选实施方式中,本发明的Cas蛋白可以是Cas9NG,其氨基酸序列如SEQ ID NO.:3所示。一般的,为了增加融合蛋白的活性,蛋白间一般通过一些柔性短肽连接,即Linker(连接肽序列)。优选的,该Linker可以选用XTEN,其编码序列如SEQ ID NO.:4所示。
在本发明中,合适的启动子包括组成型和/或诱导型启动子。优选地,为了增加效率,可以选择适用于植物细胞的强启动子,代表性的例子包括(但并不限于):CaMV 35S启动子或者UBI启动子或Actin启动子等。
选择适用于植物细胞的guide RNA的表达框,并将其与上述融合蛋白的开放表达框(ORF)构建在同一载体。
靶点设计
在本发明中,当胞嘧啶脱氨基酶通过CRISPR/Cas9系统引导至靶点位置后,脱氨基酶的作用区域就被固定的。
例如,将胞嘧啶脱氨酶APOBEC或突变型的胞嘧啶脱氨酶(CBE2.0)通过32个氨基酸的XTEN Linker连接至Cas9的N端后,本发明得到的实验结果表明,本发明的各种Cas蛋白的编辑窗口差别不大,均为PAM位点前20个碱基范围内,较佳的热点区域在3-10个碱基范围内。
遗传转化
在本发明中,对于将本发明的式I构建物导入细胞或整合到基因组的方法,没有特别限制。可以用常规的方法进行,例如将式I构建物或相应的载体通过合适的方法导入到植物细胞中。代表性的导入方法包括但并不限于:农杆菌转染法、基因枪法、显微注射法、电击法、超声波法、和聚乙二醇(PEG)介导法等。
在本发明中,对于受体植物没有特别限制,其中包括各种不同的农作物植物(如禾本科植物)、林业植物、园艺植物(如花卉植物)等。代表性的例子包括但不限于:水稻、大豆、番茄、玉米、烟草、小麦、高粱、马铃薯等。
上述DNA载体或片段导入植物细胞后,使转化的植物细胞中的DNA表达该融合蛋白和gRNA。融合胞嘧啶脱氨基酶的Cas蛋白在相应gRNA的引导下,将靶点位置的C突变为T(进而使得互补链的G突变为A)。
对于用本发明方法进行植物基因组定点替换后的植物细胞或组织或器官,可以用常规方法再生获得相应的经基因编辑的植株。例如,通过组织培养,再生获得碱基替换后的植株。
密码子优化
在本发明中,对胞嘧啶脱氨酶的编码序列进行密码子优化,尤其是植物密码子优化。
遗传密码有64种,但绝大多数倾向于利用这些密码子中的一部分。那些最被频繁利用的称为偏爱密码子或最佳密码子,那些不被经常利用的称为稀有或利用率低的密码子。实际上利用蛋白表达或生产的每种生物都表现出某种程度的密码子利用的差异或偏爱。利用偏爱密码子并避免利用率低的或稀有的密码子进行基因合成,基因的这种重设称为密码子优化。
本发明中,对胞嘧啶脱氨酶、核定位信号的氨基酸序列进行了密码子优化,采用真核细胞偏爱的密码子进行优化,优选的,采用动物细胞偏爱的密码子进行优化,更优选的,采用植物细胞偏爱的密码进行优化。
应用
本发明可以用于植物基因工程领域,用于植物研究和育种,尤其是具有经济价值的农作物、林业作物或园艺植物的遗传改良。
本发明的主要优点包括:
(1)本发明首次将Cas9核酸酶(如Cas9或Cas9NG)与优化的胞嘧啶脱氨酶、UGI、双核定位信号构成融合蛋白,在植物中成功实现了sgRNA引导的碱基定点突变(如C突变为T),并且突变效率非常高(可高达≥80%或更高),同时显著降低或基本上消除在靶位点发生插入和/或缺失(indel)的风险,并且能将indel比例降为<7%。
(2)本发明可以通过使用不同形式的Cas9,扩大植物基因组中可被定点编辑的范围。
(3)本发明首次发现,本发明的Cas9NG可识非NGG(比如NG)的PAM,并可获得非常高效的碱基编辑效率。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明中所涉及的实验材料和试剂如无特殊说明均可从市售渠道获得。
实施例1利用CBE2.0-nCas9对水稻NRT1.1B和SLR1基因进行碱基编辑及编辑效率的检测
为了直接比较优化的CBE碱基编辑器CBE2.0与第一代CBE的性能,选择NRT1.1B和SLR1基因,使用先前测试的sgRNA进行编辑。NRT1.1B控制水稻营养元素氮的吸收,第327位氨基酸由Thr到Met的改变(DNA序列由C变成T)可以增加产量;SLR1控制赤霉素的合成,影响水稻植株高度。
OsU6-sgRNA(NRT1.1B)
GGATCATGAACCAACGGCCTGGCTGTATTTGGTGGTTGTGTAGGGAGATGGGGAGAAGAAAAGCCCGATTCTCTTCGCTGTGATGGGCTGGATGCATGCGGGGGAGCGGGAGGCCCAAGTACGTGCACGGTGAGCGGCCCACAGGGCGAGTGTGAGCGCGAGAGGCGGGAGGAACAGTTTAGTACCACATTGCCCAGCTAACTCGAACGCGACCAACTTATAAACCCGCGCGCTGTCGCTTGTGTGGGCGACGGCGAGCAAGTGGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT(SEQ ID NO.:15)
OsU6-sgRNA(SLR1)
GGATCATGAACCAACGGCCTGGCTGTATTTGGTGGTTGTGTAGGGAGATGGGGAGAAGAAAAGCCCGATTCTCTTCGCTGTGATGGGCTGGATGCATGCGGGGGAGCGGGAGGCCCAAGTACGTGCACGGTGAGCGGCCCACAGGGCGAGTGTGAGCGCGAGAGGCGGGAGGAACAGTTTAGTACCACATTGCCCAGCTAACTCGAACGCGACCAACTTATAAACCCGCGCGCTGTCGCTTGTGTGCCCTCGGACCTCTCCTCCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT(SEQ ID NO.:16)
具体操作流程如下:
1.1载体构建
CBE2.0-nCas9编辑器构建
(1)通过南京金斯瑞公司合成bis-bpNLS,密码子优化的CBE2.0和由96个碱基组成桥梁序列。
(2)利用KpnI和HindIII限制性酶切位点用合成的序列替换原有CBE编辑器中的SV40 NLS-rAPOBEC1-XTEN(Lu and Zhu,2017)。
(3)采用天根生物的EasyGeno片段重组试剂盒,将另外一个包含UGI和bis-bpNLS的合成序列,经过重组反应与nCas9的3’端融合,最终获得CBE2.0-nCas9。
1.2水稻遗传转化过程
包含碱基编辑器和潮霉素抗性基因的核酸构建物(pCambia1300)导入农杆菌EHA105,然后转化水稻愈伤组织,水稻的转化、组织培养、植株生长过程按照文献中记载过程执行。(Nishimura et al.,2006;Wang et al.,2015).
1.3植株处理和碱基编辑效率的检测
从每一株转基因植株中取2-3片叶子,并从中分离出基因组DNA。靶标位点由PCR技术扩增,然后通过Sanger测序分析。测序峰图通过DSDecodeM网站分解出具体的DNA序列。测序峰图复杂的样品再通过TA克隆测序进一步验证。碱基编辑效率为靶标位点实现预期碱基替换的植株数量与鉴定的植株总数的百分比。用于PCR和测序的引物列在表S2-S3中。
表S2.用于扩增再生稻苗中靶位点的PCR引物
Figure BDA0002193112120000201
Figure BDA0002193112120000211
表S3.用于对靶PCR产物进行测序的引物。
Figure BDA0002193112120000212
1.4实验结果
如图1所示,接近80%的转基因水稻株系在NRT1.1B靶位点处具有预期的C至T置换,并且这些株系中的76%(占总转基因株系的55%)是纯合的,并且indel比例很低,只有6.9%(图2)。对SLR1位点的测试也发现大多数转基因植株具有明显的矮化表型(图3,4),测序结果显示超过80%的转基因株系在其靶位点有C到T的替换,并且72%的转基因株系为纯合或双等位突变体,并且indel比例很低,只有3.4%(图5,6)。第一代CBE碱基编辑器在以上两个位点实现的碱基替换效率只有2.7%(NRT1.1B)和13.3%(SLR1)(Lu和Zhu,2017),与之相比,本发明的优化的CBE碱基编辑器效率分别提高了26倍和6倍。
实施例2利用CBE2.0-nCas9对水稻乙酰乳酸合成酶基因(ALS)进行碱基编辑及碱基编辑效率检测
乙酰乳酸合成酶是植物体内缬氨酸、亮氨酸和异亮氨酸的合成的关键酶,ALS抑制剂常作为除草剂使用,但是该类除草剂在应用时除了抑制杂草的生长,也会抑制农作物的生长,研究表明ALS的蛋白质序列第627位Ser突变成Asn(对应DNA序列中第1880位G突变成A)赋予对咪唑啉酮除草剂的耐受性(Piao等,2018)。针对该位点设计sgRNA序列(ALSsg1,以AGG为PAM基序:GCGCCCCCACTTGGGATCATAGG(SEQ ID NO.:29)),并利用CBE2.0-nCas9进行碱基编辑,遗传转化过程以及碱基编辑效率检测参考实施例1的1.2和1.3。结果显示,超过70%的转基因植株在其靶位点处含有C到T的替换,并且大多数为纯合或双等位突变(图7,8)。该实施例进一步表明CBE2.0-nCas9具有很高的碱基编辑效率。但是由于PAM基序的限制,第1880位G并不处于编辑窗口的热点区,仅有两株植株实现第1880位G突变成A(图7)。
实施例3通过CBE2.0-nCas9NG对水稻中的乙酰乳酸合成酶基因(ALS)和5-烯醇丙酮莽草酸-3-磷酸合成酶基因(EPSPS)进行碱基编辑
1、CBE2.0-nCas9NG编辑器的构建
采用Mut
Figure BDA0002193112120000221
MultiS多重定点突变试剂盒(购自南京诺唯赞)在nSpCas9(D10A)的基础上获得nSpCas9-NG,共包含7个氨基酸的替换R1335A/L1111R/D1135V/G1218R/E1219F/A1322R/T1337R。突变后的序列通过BamHI和SpeI限制性酶切位点替换CBE2.0-nCas9编辑器中的nSpCas9(D10A)片段,获得了CBE2.0-nCas9NG编辑器。
2、CBE2.0-nCas9NG碱基编辑器对ALS的编辑效率
CBE2.0-nCas9NG碱基编辑器可以识别NGN的PAM基序,利用这一特点,重新设计了针对ALS的sgRNA序列(ALSsg2,以AGC为PAM基序:CCCCACTTGGGATCATAGGCAGC(SEQ ID NO.:32)),把第1880位G置于编辑窗口的热点区,遗传转化过程以及碱基编辑效率检测参考实施例1的1.2和1.3。碱基编辑的结果表明,将近60%的转基因植株实现了第1880位G到A的替换,并且靶区域里没有其它非目标碱基的附带突变(图9)。我们取其中两株野生型植株和两株实现碱基编辑的纯合突变植株,用“豆说好”牌咪唑乙烟酸除草剂(山东先达)喷施处理,结果表明野生型植株停止生长并逐渐枯萎,而突变体不受影响(图10,11)。
3、CBE2.0-nCas9NG碱基编辑器对EPSPS的编辑效率
有研究表明水稻中的5-烯醇丙酮莽草酸-3-磷酸合成酶基因(EPSPS)编码序列的一个单碱基替换(C317-T)能提供对草甘膦除草剂的抗性(Zhou et al.,2006))。由于该位点附近序列没有符合NGG的PAM基序,设计了一条以TGA作为PAM的sgRNA序列(EPSPS-sg1:GCGACCATTGACAGCAGCCGTGA(SEQ ID NO.:30)),利用CBE2.0-nCas9NG碱基编辑器对该位点进行碱基编辑。遗传转化以及碱基编辑效率检测参考实施例1的1.2和1.3。转基因植株的鉴定表明有17%的植株实现了C317到T的碱基替换(图12,13)。
以上两个实验的结果说明CBE2.0-nCas9NG碱基编辑器有效地扩大了碱基编辑的范围。
参考文献
1.Hua K,Tao X,Yuan F,Wang D and Zhu J(2018)Precise A.T to G.C BaseEditing in the Rice Genome.MOL PLANT 11:627-630.
2.Koblan LW,Doman JL,Wilson C,Levy JM,Tay T,Newby GA,Maianti JP,Raguram A and Liu DR(2018)Improving cytidine and adenine base editors byexpression optimization and ancestral reconstruction.NAT BIOTECHNOL 36:843-846.
3.Nishimasu H,Shi X,Ishiguro S,Gao L,Hirano S,Okazaki S,Noda T,Abudayyeh OO,Gootenberg JS,Mori H,Oura S,Holmes B,Tanaka M,Seki M,Hirano H,Aburatani H,Ishitani R,Ikawa M,Yachie N,Zhang F and Nureki O(2018)EngineeredCRISPR-Cas9 nuclease with expanded targeting space.SCIENCE 361:1259-1262.
4.Hu,J.H.,Miller,S.M.,Geurts,M.H.,Tang,W.,Chen,L.,Sun,N.,Zeina,C.M.,Gao,X.,Rees,H.A.,Lin,Z.,et al.(2018).Evolved Cas9 variants with broad PAMcompatibility and high DNA specificity.Nature 556,57-63.
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 山东舜丰生物科技有限公司
<120> 一种用于基因定点突变的核酸构建物
<130> P2019-1322
<150> CN201910173148.8
<151> 2019-03-07
<160> 32
<170> SIPOSequenceListing 1.0
<210> 1
<211> 684
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
agcagtgaaa ccggaccagt ggcagtggac ccaaccctga ggagacggat tgagccccat 60
gaatttgaag tgttctttga cccaagggag ctgaggaagg agacatgcct gctgtacgag 120
atcaagtggg gcacaagcca caagatctgg cgccacagct ccaagaacac cacaaagcac 180
gtggaagtga atttcatcga gaagtttacc tccgagcggc acttctgccc ctctaccagc 240
tgttccatca catggtttct gtcttggagc ccttgcggcg agtgttccaa ggccatcacc 300
gagttcctgt ctcagcaccc taacgtgacc ctggtcatct acgtggcccg gctgtatcac 360
cacatggacc agcagaacag gcagggcctg cgcgatctgg tgaattctgg cgtgaccatc 420
cagatcatga cagccccaga gtacgactat tgctggcgga acttcgtgaa ttatccacct 480
ggcaaggagg cacactggcc aagataccca cccctgtgga tgaagctgta tgcactggag 540
ctgcacgcag gaatcctggg cctgcctcca tgtctgaata tcctgcggag aaagcagccc 600
cagctgacat ttttcaccat tgctctgcag tcttgtcact atcagcggct gcctcctcat 660
attctgtggg ctacaggcct taaa 684
<210> 2
<211> 1368
<212> PRT
<213> 人工序列(artificial sequence)
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 3
<211> 1368
<212> PRT
<213> 人工序列(artificial sequence)
<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Arg Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Arg Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Val Tyr Arg Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 4
<211> 96
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
tccggaggat ctagcggagg ctcctctggc tctgagacac ctggcacaag cgagagcgca 60
acacctgaaa gcagcggggg cagcagcggg ggatcc 96
<210> 5
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtc 57
<210> 6
<211> 284
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
tgattgatcg atagagctcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgg 284
<210> 7
<211> 96
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
tctggaggat ctagcggagg ctcctctggc agcgagacac caggaacaag cgagtcagca 60
acaccagaga gcagtggcgg cagcagcggc ggatcc 96
<210> 8
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 8
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His Lys
35 40 45
Ile Trp Arg His Ser Ser Lys Asn Thr Thr Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Thr Ser
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Lys Ala Ile Thr Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu Val
100 105 110
Ile Tyr Val Ala Arg Leu Tyr His His Met Asp Gln Gln Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Ala Pro Glu Tyr Asp Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro
145 150 155 160
Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys Leu
165 170 175
Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 9
<211> 579
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
agcggcggga gcggcgggag cggcgggagc ggggggagca ctaatctgag cgacatcatt 60
gagaaggaga ctgggaaaca gctggtcatt caggagtcca tcctgatgct gcctgaggag 120
gtggaggaag tgatcggcaa caagccagag tctgacatcc tggtgcacac cgcctacgac 180
gagtccacag atgagaatgt gatgctgctg acctctgacg cccccgagta taagccttgg 240
gccctggtca tccaggattc taacggcgag aataagatca agatgctgag cggaggctcc 300
ggaggatctg gaggcagcac caacctgtct gacatcatcg agaaggagac aggcaagcag 360
ctggtcatcc aggagagcat cctgatgctg cccgaagaag tcgaagaagt gatcggaaac 420
aagcctgaga gcgatatcct ggtccatacc gcctacgacg agagtaccga cgaaaatgtg 480
atgctgctga catccgacgc cccagagtat aagccctggg ctctggtcat ccaggattcc 540
aacggagaga acaaaatcaa aatgctgtct ggcggctca 579
<210> 10
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 10
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His Lys
35 40 45
Ile Trp Arg His Ser Ser Lys Asn Thr Thr Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Thr Ser
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Lys Ala Ile Thr Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu Val
100 105 110
Ile Tyr Val Ala Arg Leu Tyr His His Met Asp Gln Gln Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Ala Pro Glu Tyr Asp Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro
145 150 155 160
Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys Leu
165 170 175
Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 11
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 11
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His Lys
35 40 45
Ile Trp Arg Asn Ser Gly Lys Asn Thr Thr Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Ile Ser
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
85 90 95
Lys Ala Ile Arg Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu Val
100 105 110
Ile Tyr Val Ala Arg Leu Phe Gln His Met Asp Gln Gln Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Ala Ser Glu Tyr Asp His Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro
145 150 155 160
Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys Leu
165 170 175
Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 12
<211> 150
<212> PRT
<213> 人工序列(artificial sequence)
<400> 12
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Glu Phe Phe Asn Arg Asn Tyr Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Tyr Leu Leu Tyr Glu Ile Lys Trp Gly Lys Glu Ser Lys
35 40 45
Ile Trp Arg His Thr Ser Asn Asn Arg Thr Gln His Ala Glu Val Asn
50 55 60
Phe Leu Glu Asn Phe Phe Asn Glu Leu Tyr Phe Asn Pro Ser Thr His
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Lys Ala Ile Val Glu Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Leu Cys Glu Asp Glu Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asn
130 135 140
Leu Pro Asp Tyr Asn Tyr
145 150
<210> 13
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 13
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Phe Tyr Phe Gln Phe Asn Asn Asp Pro Arg Ala Cys Arg
20 25 30
Arg Lys Thr Tyr Leu Cys Tyr Glu Leu Lys Gln Asp Gly Ser Thr Trp
35 40 45
Val Trp Lys Arg Thr Leu His Asn Lys Gly Arg His Ala Glu Ile Cys
50 55 60
Phe Leu Glu Lys Ile Ser Ser Leu Glu Lys Leu Asp Pro Ala Gln His
65 70 75 80
Tyr Arg Ile Thr Trp Tyr Met Ser Trp Ser Pro Cys Ser Asn Cys Ala
85 90 95
Gln Lys Ile Val Asp Phe Leu Lys Glu His Pro His Val Asn Leu Arg
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Tyr His Glu Glu Glu Arg Tyr Gln Glu
115 120 125
Gly Leu Arg Asn Leu Arg Arg Ser Gly Val Ser Ile Arg Val Met Asp
130 135 140
Leu Pro Asp Phe Glu His Cys Trp Glu Thr Phe Val Asp Asn Gly Gly
145 150 155 160
Gly Pro Phe Gln Pro Trp Pro Gly Leu Glu Glu Leu Asn Ser Lys Gln
165 170 175
Leu Ser Arg Arg Leu Gln Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 14
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 14
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Phe His Phe Gln Phe Asn Asn Asp Pro Arg Ala Tyr Arg
20 25 30
Arg Lys Thr Tyr Leu Cys Tyr Glu Leu Lys Gln Asp Gly Ser Thr Trp
35 40 45
Val Leu Asp Arg Thr Leu Arg Asn Lys Gly Arg His Ala Glu Ile Cys
50 55 60
Phe Leu Asp Lys Ile Asn Ser Trp Glu Arg Leu Asp Pro Ala Gln His
65 70 75 80
Tyr Arg Val Thr Trp Tyr Met Ser Trp Ser Pro Cys Ser Asn Cys Ala
85 90 95
Gln Gln Val Val Asp Phe Leu Lys Glu His Pro His Val Asn Leu Arg
100 105 110
Ile Phe Ala Ala Arg Leu Tyr Tyr His Glu Gln Arg Arg Tyr Gln Glu
115 120 125
Gly Leu Arg Ser Leu Arg Gly Ser Gly Val Pro Val Ala Val Met Thr
130 135 140
Leu Pro Asp Phe Glu His Cys Trp Glu Thr Phe Val Asp His Gly Gly
145 150 155 160
Arg Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu Leu Asn Ser Arg Ser
165 170 175
Leu Ser Arg Arg Leu Gln Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 15
<211> 348
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
ggatcatgaa ccaacggcct ggctgtattt ggtggttgtg tagggagatg gggagaagaa 60
aagcccgatt ctcttcgctg tgatgggctg gatgcatgcg ggggagcggg aggcccaagt 120
acgtgcacgg tgagcggccc acagggcgag tgtgagcgcg agaggcggga ggaacagttt 180
agtaccacat tgcccagcta actcgaacgc gaccaactta taaacccgcg cgctgtcgct 240
tgtgtgggcg acggcgagca agtgggtttt agagctagaa atagcaagtt aaaataaggc 300
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttt 348
<210> 16
<211> 348
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
ggatcatgaa ccaacggcct ggctgtattt ggtggttgtg tagggagatg gggagaagaa 60
aagcccgatt ctcttcgctg tgatgggctg gatgcatgcg ggggagcggg aggcccaagt 120
acgtgcacgg tgagcggccc acagggcgag tgtgagcgcg agaggcggga ggaacagttt 180
agtaccacat tgcccagcta actcgaacgc gaccaactta taaacccgcg cgctgtcgct 240
tgtgtgccct cggacctctc ctcctgtttt agagctagaa atagcaagtt aaaataaggc 300
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttt 348
<210> 17
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
cttactttgg ctgccaagaa aca 23
<210> 18
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
catggggatg ggcggcgtga 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
ttggaccagc agaagaggga 20
<210> 20
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
caactttgga ggtttcgcac tg 22
<210> 21
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
tgatggtggt cgcccagatg 20
<210> 22
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
accgcccaga gaggaagacg acga 24
<210> 23
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
ggattaccat gccaagcaca tc 22
<210> 24
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
tcgcttgagc ttggcaggaa ta 22
<210> 25
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
cttactttgg ctgccaagaa aca 23
<210> 26
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
catggggatg ggcggcgtga 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
ttggaccagc agaagaggga 20
<210> 28
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
ctggttatta gggcacaac 19
<210> 29
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
gcgcccccac ttgggatcat agg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
gcgaccattg acagcagccg tga 23
<210> 31
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
aaaagaaccg ccgacggcag cgaattcgag cccaagaaga agaggaaagt c 51
<210> 32
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
ccccacttgg gatcataggc agc 23

Claims (14)

1.一种核酸构建物,其特征在于,所述核酸构建物具有5’-3’的式I结构:
I1-Z1-Z2-I2 (I)
式中,
I1为第一整合元件;
I2为第二整合元件;
Z1为第一表达盒;
Z2为第二表达盒;
并且,Z1和Z2中的一个表达盒具有Ia结构,而另一个表达盒具有式Ib结构:
P1-S1-X1-L1-X2-X4-L2-X3 (Ia)
P2-Y1 (Ib);
式中,
P1、S1、X1、L1、X2、X4、L2、X3、P2、Y1分别为用于构成所述构建物的元件;
P1为第一启动子,所述第一启动子为玉米泛素启动子;
S1为核定位信号的编码序列;
X1为胞嘧啶脱氨酶的编码序列;
L1为无或第一连接肽的编码序列;
X2为Cas9核酸酶的编码序列,所述的Cas9核酸酶是无切割活性或单链切割活性的;
X4为尿嘧啶糖苷酶抑制剂UGI的编码序列;
L2为无或第二连接肽的编码序列;
X3为核定位信号的编码序列;
P2为第二启动子,所述第二启动子为RNA聚合酶III依赖的启动子;
Y1为sgRNA的编码序列;
并且,各“-”为键或核苷酸连接序列;
所述核定位信号为bpNLS;
所述的胞嘧啶脱氨酶选自CBE2.0、CBE2.1、CBE2.2、CBE2.3或CBE2.4;
所述X2元件的氨基酸序列为SEQ ID NO.:2或SEQ ID NO.:3所示;
所述X4元件的核苷酸序列为SEQ ID NO.:9所示。
2.如权利要求1所述的核酸构建物,其特征在于,所述核酸构建物的长度为3000-10000bp。
3.如权利要求2所述的核酸构建物,其特征在于,所述核酸构建物的长度为4000-8500bp。
4.如权利要求3所述的核酸构建物,其特征在于,所述核酸构建物的长度为4000-6000bp。
5.一种融合蛋白,其特征在于,所述的融合蛋白包括胞嘧啶脱氨酶和Cas9核酸酶,并且所述融合蛋白由权利要求1所述的核酸构建物编码。
6.一种载体,其特征在于,所述载体含有权利要求1所述的核酸构建物。
7.一种基因工程细胞,其特征在于,所述细胞含有权利要求1所述的核酸构建物,或其基因组整合有一个或多个权利要求1所述的核酸构建物。
8.如权利要求7所述的基因工程细胞,其特征在于,所述的细胞为植物细胞。
9.一种用于基因编辑的试剂组合,其特征在于,包括:
(i) 第一核酸构建物,或含有所述第一核酸构建物的第一载体,所述第一核酸构建物具有从5’-3’的式Ia结构:
P1-S1-X1-L1-X2-X4-L2-X3 (Ia)
其中,
P1为第一启动子,所述第一启动子为玉米泛素启动子;
S1为核定位信号的编码序列;
X1为胞嘧啶脱氨酶的编码序列;
L1为无或第一连接肽的编码序列;
X2为Cas9核酸酶的编码序列,所述的Cas9核酸酶是无切割活性或单链切割活性的;
X4为尿嘧啶糖苷酶抑制剂UGI的编码序列;
L2为无或第二连接肽的编码序列;
X3为核定位信号的编码序列;
并且,“-”为键或核苷酸连接序列;
所述核定位信号为bpNLS;
所述的胞嘧啶脱氨酶选自CBE2.0、CBE2.1、CBE2.2、CBE2.3或CBE2.4;
所述X2元件的氨基酸序列为SEQ ID NO.:2或SEQ ID NO.:3所示;
所述X4元件的核苷酸序列为SEQ ID NO.:9所示;和
(ii) 第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有从5’-3’的式Ib所示的结构:
P2-Y1 (Ib);
其中,P2为第二启动子,所述第二启动子为RNA聚合酶III依赖的启动子;
Y1为sgRNA的编码序列;
并且,“-”为键或核苷酸连接序列。
10.一种试剂盒,其特征在于,所述试剂盒含有权利要求9所述的试剂组合。
11.一种对植物进行基因编辑的方法,其特征在于,包括步骤:
(i) 提供待编辑植物;和
(ii) 将权利要求1所述的核酸构建物、权利要求6所述的载体或权利要求9所述的试剂组合导入所述待编辑植物的植物细胞,从而在所述植物细胞内进行基因编辑。
12.一种制备经基因编辑的植物细胞的方法,其特征在于,包括步骤:
将权利要求1所述的核酸构建物、权利要求6所述的载体或权利要求9所述的试剂组合转染植物细胞,使得所述核酸构建物与所述植物细胞中的染色体发生定点替换,从而制得所述经基因编辑的植物细胞。
13.一种权利要求1所述的核酸构建物或权利要求5所述的融合蛋白或权利要求6所述的载体或权利要求7所述的基因工程细胞或权利要求9所述的试剂组合或权利要求10所述的试剂盒的用途,其特征在于,用于对植物进行基因编辑。
14.一种制备经基因编辑的植物的方法,其特征在于,包括步骤:
将权利要求12所述方法制备的所述经基因编辑的植物细胞再生为植物体,从而获得所述经基因编辑的植物。
CN201910839046.5A 2019-03-06 2019-09-05 一种用于基因定点突变的核酸构建物 Active CN110527695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/078079 WO2020177751A1 (zh) 2019-03-06 2020-03-05 一种用于基因编辑的核酸构建物

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019101731488 2019-03-07
CN201910173148 2019-03-07

Publications (2)

Publication Number Publication Date
CN110527695A CN110527695A (zh) 2019-12-03
CN110527695B true CN110527695B (zh) 2020-06-16

Family

ID=68667169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910839046.5A Active CN110527695B (zh) 2019-03-06 2019-09-05 一种用于基因定点突变的核酸构建物

Country Status (1)

Country Link
CN (1) CN110527695B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020177751A1 (zh) * 2019-03-06 2020-09-10 山东舜丰生物科技有限公司 一种用于基因编辑的核酸构建物
BR112022017704A2 (pt) * 2020-03-04 2022-11-01 Suzhou Qi Biodesign Biotechnology Company Ltd Método e sistema de edição de genoma multiplex
CN113774082A (zh) * 2020-05-22 2021-12-10 山东舜丰生物科技有限公司 一种核酸表达的方法
CN112080513A (zh) * 2020-09-16 2020-12-15 中国农业科学院植物保护研究所 一套编辑范围扩展的水稻人工基因组编辑系统及其应用
CN112522302B (zh) * 2020-12-11 2022-04-29 安徽省农业科学院水稻研究所 水稻双向单碱基编辑的共转录单元基因abe-cbe系统及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016123578A1 (en) * 2015-01-30 2016-08-04 The Regents Of The University Of California Protein delivery in primary hematopoietic cells
CN106609282A (zh) * 2016-12-02 2017-05-03 中国科学院上海生命科学研究院 一种用于植物基因组定点碱基替换的载体
CN109306361A (zh) * 2018-02-11 2019-02-05 华东师范大学 一种新的a/t到g/c碱基定点转换的基因编辑系统
CN109843915A (zh) * 2016-05-06 2019-06-04 朱诺治疗学股份有限公司 基因工程化细胞及其制备方法
CN110157726A (zh) * 2018-02-11 2019-08-23 中国科学院上海生命科学研究院 植物基因组定点替换的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016123578A1 (en) * 2015-01-30 2016-08-04 The Regents Of The University Of California Protein delivery in primary hematopoietic cells
CN109843915A (zh) * 2016-05-06 2019-06-04 朱诺治疗学股份有限公司 基因工程化细胞及其制备方法
CN106609282A (zh) * 2016-12-02 2017-05-03 中国科学院上海生命科学研究院 一种用于植物基因组定点碱基替换的载体
CN109306361A (zh) * 2018-02-11 2019-02-05 华东师范大学 一种新的a/t到g/c碱基定点转换的基因编辑系统
CN110157726A (zh) * 2018-02-11 2019-08-23 中国科学院上海生命科学研究院 植物基因组定点替换的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Precise A•T to G•C base editing in the zebrafish genome;Qin W;《BMC Biology》;20180131;第16卷(第1期);全文 *

Also Published As

Publication number Publication date
CN110527695A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN110527695B (zh) 一种用于基因定点突变的核酸构建物
CN110526993B (zh) 一种用于基因编辑的核酸构建物
CN108866092B (zh) 抗除草剂基因的产生及其用途
CN110157726B (zh) 植物基因组定点替换的方法
US20210403901A1 (en) Targeted mutagenesis using base editors
CN112126637B (zh) 腺苷脱氨酶及其相关生物材料与应用
EP0663012A1 (en) CYANOBACTERIAL AND PLANT ACETYL-CoA CARBOXYLASE
CN112266420B (zh) 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
WO2018098935A1 (zh) 一种用于植物基因组定点碱基替换的载体
CN105102474A (zh) 组成型大豆启动子
CN113994007B (zh) 一种核酸表达的方法
NZ502301A (en) Methods and compositions for producing plants and microorganisms that express feedback insensitive threonine dehydratase/deaminase
US20230332167A1 (en) Plant promoter for transgene expression
EP3676383B1 (en) Compositions and methods for expressing transgenes using regulatory elements from chlorophyll binding ab genes
WO2019234132A1 (en) Base editing in polymerase theta deficient plants
WO2020177751A1 (zh) 一种用于基因编辑的核酸构建物
CA3072271A1 (en) Plant promoter for transgene expression
CN114686456A (zh) 基于双分子脱氨酶互补的碱基编辑系统及其应用
CA3079549A1 (en) Plant promoter for transgene expression
CN114196644B (zh) 一种蛋白棕榈酰化转移酶dhhc16及其在提高水稻耐盐方面的应用
CN116724119A (zh) 除草剂抗性植物
US20230127011A1 (en) Methods and compositions for herbicide tolerance in plants
WO2023115030A2 (en) Lodging resistance in eragrostis tef
CN115109798A (zh) 改进的cg碱基编辑系统
CN117004583A (zh) 2odd蛋白、基因、载体、细胞、组合物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant