CN112080513A - 一套编辑范围扩展的水稻人工基因组编辑系统及其应用 - Google Patents

一套编辑范围扩展的水稻人工基因组编辑系统及其应用 Download PDF

Info

Publication number
CN112080513A
CN112080513A CN202010971535.9A CN202010971535A CN112080513A CN 112080513 A CN112080513 A CN 112080513A CN 202010971535 A CN202010971535 A CN 202010971535A CN 112080513 A CN112080513 A CN 112080513A
Authority
CN
China
Prior art keywords
leu
lys
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010971535.9A
Other languages
English (en)
Inventor
周焕斌
周雪平
徐子妍
旷永洁
任斌
闫大琦
严芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Plant Protection of Chinese Academy of Agricultural Sciences filed Critical Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority to CN202010971535.9A priority Critical patent/CN112080513A/zh
Publication of CN112080513A publication Critical patent/CN112080513A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一套编辑范围扩展的水稻人工基因编辑系统及其应用。本发明提供了DNA分子在水稻单碱基编辑中的应用,该DNA分子由含Cas蛋白+脱氨酶表达盒和sgRNA表达盒组成;所述含Cas蛋白+脱氨酶表达盒表达融合蛋白,所述融合蛋白含有Cas蛋白和脱氨酶,所述脱氨酶为胞嘧啶脱氨酶和/或腺嘌呤脱氨酶,所述Cas蛋白为氨基酸序列是SEQ ID No.6的第212‑1578位的蛋白质;所述sgRNA表达盒表达sgRNA,所述sgRNA的靶标序列是5′‑N19‑20PAM‑3′。本发明能广泛地应用于水稻基因组中靶标基因的敲除或单碱基的定向突变。

Description

一套编辑范围扩展的水稻人工基因组编辑系统及其应用
技术领域
本发明涉及一套编辑范围扩展的水稻人工基因组编辑系统及其应用。
背景技术
水稻(Oryza sativa L.)是我国乃至世界上最主要的粮食作物,世界上近一半人口将稻米作为主食。中国也是世界上水稻总产量最高的国家,占全球总量的30%左右。但是,随着全球人口的不断增长,以及在生产过程中,水稻各种病害严重制约着水稻的生长发育,影响水稻的产量和品质降低,威胁着全球的粮食安全。因此,改善稻米品质,增加水稻植株抗病、抗逆性、提高水稻产量等研究以保证粮食的稳定供给是人类社会可持续性发展的重大课题。
近年来,基于CRISPR/Cas系统的植物基因组编辑技术发展迅速,在植物中实现了高效便捷的单基因敲除、多基因敲除、DNA大片段删除和基因定点插入替换等,尤其是后面发展而来的单碱基编辑技术和引导编辑技术,更是实现了在单个核苷酸水平上的精准修饰,包括单碱基定向替换和DNA小片段精准插入缺失,这些技术的发展和成熟极大地促进了植物功能基因组学研究和农作物精准遗传改良,加速植物生物学研究进程和保障农业粮食安全生产。植物单碱基编辑技术是由碱基脱氨酶和切口酶Cas9(D10A)形成融合蛋白,在sgRNA的引导下,融合蛋白特异地结合靶位点并将位于碱基编辑活性窗口内的靶碱基胞嘧啶C或腺嘌呤A经过脱氨、DNA修复和复制后逐渐被分别替换为胸腺嘧啶T或鸟嘌呤G,最终形成C向T(胞嘧啶碱基编辑)和A向G(腺嘌呤碱基编辑)的定向替换。与基因定点敲除的碱基随机插入缺失相比,单碱基编辑技术可实现精准碱基修饰,对基因功能研究和作物缺陷型基因矫正更有应用价值。但是通常由于靶碱基位置的固定性,需要同时考虑碱基编辑活性窗口和识别PAM序列,这就使得打靶sgRNA引物的选择受到严重限制,而这种限制主要是由碱基编辑器中所用Cas蛋白的识别PAM导致的。
目前,植物基因组编辑技术中应用最为广泛的系统是来源于化脓链球菌Streptococcus pyogenes的CRISPR/SpCas9系统,在该系统中,SpCas9对靶位点的切割需要识别靶位点序列3′端保守的PAM序列(主要为NGG)。但是对NGG PAM序列的需求,也使得该系统在实际应用过程中受到诸多的限制,比如需要编辑的靶位点附近没有合适的NGG PAM序列等。尤其是在使用单碱基编辑技术对特定靶碱基进行定向编辑时,需要同时考虑碱基编辑活性窗口和识别PAM序列,这就使得单碱基编辑技术的应用更受限制。
因此,能够在植物中开发出一种高效且识别非典型PAM序列的基因组编辑技术,不仅能够在植物全基因组范围内实现基因编辑并且大大地提高基因编辑效率,还能极大地扩展单碱基编辑技术在植物中的编辑范围,这将对植物功能基因组学研究以及作物精准育种等方面具有重要的促进作用。
发明内容
本发明所要解决的技术问题是如何开发出高效且既适用于典型PAM序列(如NGG)又适用于非典型PAM序列的植物基因组编辑技术(如水稻基因组编辑技术)。
由于现有技术中的基因组编辑技术存在PAM的限制,进而使得在水稻基因组任意位点进行基因编辑受到了限制,为了解决这一技术问题,本发明提供了DNA分子(基因编辑工具盒)在水稻单碱基编辑中的应用。
本发明所提供的DNA分子在水稻单碱基编辑中的应用中,所述DNA分子由含Cas蛋白+脱氨酶表达盒和sgRNA表达盒组成;所述含Cas蛋白+脱氨酶表达盒表达融合蛋白,所述融合蛋白含有Cas蛋白和脱氨酶,所述脱氨酶为胞嘧啶脱氨酶(cytosine deaminase)和/或腺嘌呤脱氨酶(adenosine deaminase),所述Cas蛋白为氨基酸序列是SEQ ID No.6的第212-1578位的蛋白质;所述sgRNA表达盒表达sgRNA,所述sgRNA的靶标序列是5′-N19-20PAM-3′,所述N19-20为19-20个N,所述PAM(protospacer adjacent motif)为3个N;所述N为A、G、C或T。
上述应用中,所述含Cas蛋白+脱氨酶表达盒和sgRNA表达盒组成可以在一种DNA分子上,也可以分别在两种DNA分子上。
上述应用中,所述含Cas蛋白+脱氨酶表达盒为含Cas蛋白+胞嘧啶脱氨酶表达盒或含Cas蛋白+腺嘌呤脱氨酶表达盒;所述含Cas蛋白+胞嘧啶脱氨酶表达盒表达名称为Cas蛋白/胞嘧啶脱氨酶的融合蛋白,所述Cas蛋白/胞嘧啶脱氨酶含有所述胞嘧啶脱氨酶、所述Cas蛋白和尿嘧啶DNA糖基化酶抑制剂(uracil glycosylase inhibitor,UGI);所述含Cas蛋白+腺嘌呤脱氨酶表达盒表达名称为Cas蛋白/腺嘌呤脱氨酶的融合蛋白,所述Cas蛋白/腺嘌呤脱氨酶含有所述腺嘌呤脱氨酶和所述Cas蛋白。
上述应用中,所述Cas蛋白/胞嘧啶脱氨酶可为由所述胞嘧啶脱氨酶、所述Cas蛋白、所述尿嘧啶DNA糖基化酶抑制剂和核定位信号(nuclear localization signal,NLS)连接而成的蛋白质。该蛋白质以下简称碱基编辑器(base editor)rBE66;所述Cas蛋白/腺嘌呤脱氨酶可为由所述腺嘌呤脱氨酶、所述Cas蛋白和所述核定位信号连接而成的蛋白质。该蛋白质以下简称碱基编辑器(base editor)rBE68。
在本发明的一个实施例中,rBE66的氨基酸序列是序列表中的SEQ ID No.6。SEQID No.6中,第1-195位是hAID*Δ的氨基酸序列,第196-211位是连接肽的氨基酸序列,第212-1578位是Cas9-AA(D10A)的氨基酸序列,第1579-1669位是UGI的氨基酸序列,第1670-1676位是NLS的氨基酸序列。
在本发明的一个实施例中,rBE68的氨基酸序列是序列表中的SEQ ID No.8。SEQID No.8中,第1-167位是wtTadA的氨基酸序列,第168-199位是连接肽的氨基酸序列,第200-365位是TadA7.10的氨基酸序列,第366-397位是连接肽的氨基酸序列,第398-1764位是Cas9-AA(D10A)的氨基酸序列,第1765-1774位是NLS的氨基酸序列。
上述应用中,所述含Cas蛋白+脱氨酶表达盒中含有所述Cas蛋白的编码基因,所述Cas蛋白的编码基因的编码链的编码序列(CDS)是序列表中的SEQ ID No.5的第640-4740位。
上述应用中,所述含Cas蛋白+胞嘧啶脱氨酶表达盒含有所述Cas蛋白/胞嘧啶脱氨酶的编码基因,所述Cas蛋白/胞嘧啶脱氨酶的编码基因的编码链的编码序列(CDS)是序列表中的SEQ ID No.5;所述含Cas蛋白+腺嘌呤脱氨酶表达盒含有所述Cas蛋白/腺嘌呤脱氨酶的编码基因,所述Cas蛋白/腺嘌呤脱氨酶的编码基因的编码链的编码序列(CDS)是序列表中的SEQ ID No.7。
上述应用中,所述含Cas蛋白+脱氨酶表达盒,是指能够在宿主细胞(如植物细胞)中表达所述融合蛋白的DNA,该DNA不但可包括启动所述融合蛋白基因转录的启动子,还可包括终止所述融合蛋白基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用于本发明的启动子包括但不限于:组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。启动子的例子包括但不限于:玉米的Ubiquitin启动子、花椰菜花叶病毒的组成型启动子35S;来自西红柿的创伤诱导型启动子,亮氨酸氨基肽酶("LAP",Chao等人(1999)Plant Physiology 120:979-992);来自烟草的化学诱导型启动子,病程相关蛋白1(PR1)(由水杨酸和BTH(苯并噻二唑-7-硫代羟酸S-甲酯)诱导);西红柿蛋白酶抑制剂II启动子(PIN2)或LAP启动子(均可用茉莉酮酸甲酯诱导);热休克启动子(美国专利5,187,267);四环素诱导型启动子(美国专利5,057,422);种子特异性启动子,如谷子种子特异性启动子pF128(CN101063139B(中国专利2007 1 0099169.7)),种子贮存蛋白质特异的启动子(例如,菜豆球蛋白、napin,oleosin和大豆beta conglycin的启动子(Beachy等人(1985)EMBOJ.4:3047-3053))。它们可单独使用或与其它的植物启动子结合使用。此处引用的所有参考文献均全文引用。合适的转录终止子包括但不限于:农杆菌胭脂碱合成酶终止子(NOS终止子)、花椰菜花叶病毒CaMV 35S终止子、tml终止子、豌豆rbcS E9终止子和胭脂氨酸和章鱼氨酸合酶终止子(参见,例如:Odell等人(I985)Nature 313:810;Rosenberg等人(1987)Gene,56:125;Guerineau等人(1991)Mol.Gen.Genet,262:141;Proudfoot(1991)Cell,64:671;Sanfacon等人Genes Dev.,5:141;Mogen等人(1990)Plant Cell,2:1261;Munroe等人(1990)Gene,91:151;Ballad等人(1989)Nucleic Acids Res.17:7891;Joshi等人(1987)Nucleic Acid Res.,15:9627)。
在本发明的一个实施例中,所述含Cas蛋白+胞嘧啶脱氨酶表达盒由Ubip启动子(核苷酸序列是SEQ ID No.3),rBE66基因(即Cas蛋白/胞嘧啶脱氨酶的编码基因,其编码链的CDS是序列表中的SEQ ID No.5)和NOS终止子(核苷酸序列是SEQ ID No.4)连接而成。SEQID No.5中,第1-6位为BamHI识别位点,第7-591位为hAID*Δ的CDS,第592-639位为连接肽的CDS,第640-4740位为Cas9-AA(D10A)的CDS,第4741-5013位为UGI的CDS,第5014-5034位为NLS的CDS,第5035-5037位为终止密码子TGA,第5038-5043位为BcuI识别位点。pUbi-rBE66中含有用于gateway LR反应的元件attR1-ccdB-attR2。
在本发明的一个实施例中,所述含Cas蛋白+腺嘌呤脱氨酶表达盒由Ubip启动子(核苷酸序列是SEQ ID No.3),rBE68基因(即Cas蛋白/腺嘌呤脱氨酶的编码基因,其编码链的CDS是序列表中的SEQ ID No.7)和NOS终止子(核苷酸序列是SEQ ID No.4)连接而成。SEQID No.7中,第1-6位为BamHI识别位点,第7-507位为wtTadA的CDS,第508-603位为连接肽的CDS,第604-1101位为TadA7.10的CDS,第1102-1197位为连接肽的CDS,第1198-5298位为Cas9-AA(D10A)的CDS,第5299-5328位为NLS的CDS,第5329-5331位为终止密码子TGA,第5332-5337位为BcuI识别位点。
上述应用中,所述PAM可为下述任一种:
L1、5′-NAN-3′,L2、5′-NGN-3′,L3、5′-NCG-3′,L4、5′-NCT-3′,L5、5′-NCC-3′,L6、5′-NTC-3′,所述N为A、G、C或T。
上述应用中,所述5′-NAN-3′可为5′-NAG-3′、5′-NAA-3′、5′-NAT-3′和5′-NAC-3′,所述5′-NGN可为5′-NGA-3′、5′-NGT-3′、5′-NGC-3′和5′-NGG-3′。
与上述应用中任一所述的DNA分子相关的生物材料,也属于本发明的保护范围:
B1)上述应用中任一所述的DNA分子;
B2)含有B1)所述DNA分子的重组载体;
B3)含有B1)所述DNA分子的重组微生物;
B4)含有B2)所述的重组载体的重组微生物;
B5)由上述应用中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒和所述sgRNA表达盒组成的组合物;
B6)由上述应用中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒的重组载体和含有上述应用中任一所述的DNA分子中的所述sgRNA表达盒的重组载体组成的组合物;
B7)由上述应用中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒的重组微生物和含有上述应用中任一所述的DNA分子中的所述sgRNA表达盒的重组微生物组成的组合物;
B8)由上述应用中任一所述的DNA分子中的所述融合蛋白和上述应用中任一所述的DNA分子中的所述sgRNA组成的组合物。
上述生物材料中,所述重组微生物具体可为细菌,酵母,藻和真菌。B5)-和B8)所述的组合物可为用于植物单碱基编辑的组合物,如水稻单碱基编辑的组合物。
上述应用中任一所述的Cas蛋白、上述应用中任一所述的DNA分子或所述生物材料在植物基因组编辑中的应用也属于本发明的保护范围。
上述应用中,所述植物基因组编辑可为植物基因组单碱基编辑。所述植物基因组单碱基编辑可为水稻单碱基编辑。
上述应用中,所述植物可为双子叶植物或单子叶植物。所述单子叶植物可为水稻。
在将所述DNA分子(基因编辑工具盒)导入受体植物时,可以采用PEG介导转化的方法,也可以采用基因枪法或农杆菌侵染法中的一种将所述基因编辑工具盒导入到水稻原生质体或愈伤组织中,这是本领域技术人员容易理解的。本领域的技术人员公知,水稻基因组DNA由两条链组成,因此,所述靶核苷酸序列可以在其中互补的任意一条链上。例如,当所述靶核苷酸序列位于某一功能基因的一正义链中时,如果在该功能基因的特定位点上发生一至数个碱基的缺失或插入,并且如果其中的一种突变能够获得预期的使该基因移码突变而产生基因失活,则可以采用此系统来实现,即可以通过直接进行正义链上的碱基缺失或插入,得到水稻基因敲除突变体;当所述靶核苷酸序列位于某一功能基因的正义条链中时,如果该功能基因的特定位点上的C被定点突变为T后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,则可以采用此系统来实现,即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的C替换为T,得到水稻基因功能“矫正”突变体;或当所述靶核苷酸序列位于某一功能基因的反义链中时,如果该功能基因的特定位点上的G被定点突变为A后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,也可以采用此系统来实现,即可以通过将反义链中的C被定点突变为T,进而使正义链中的相应互补的G替换为A来改变正义链中的所述三联体密码子编码氨基酸,得到水稻基因功能“矫正”突变体;当所述靶核苷酸序列位于某一功能基因的反义链中时,如果该功能基因的特定位点上的T被定点突变为C后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,则可以采用此系统来实现,即可以通过将该反义链中的A被定点突变为G,进而使正义链中的相应互补的T替换为C来改变正义链中的所述三联体密码子编码氨基酸,得到水稻基因功能“矫正”突变体;或当所述靶核苷酸序列位于某一功能基因的正义链中时,如果该功能基因的特定位点上的A被定点突变为G后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,也可以采用此系统来实现,即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的A替换为G,从而得到水稻基因功能“矫正”突变体。
实验证明,胞嘧啶碱基编辑器rBE66能够识别NGC、NAG和NGA PAM(即NRN PAM,R为A或G)完成靶碱基编辑,对OsCOI2的NGC PAM靶点的靶碱基编辑效率为26.00%;对OsCOI2的NAG PAM靶点的靶碱基编辑效率为34.15%,靶核苷酸序列5′到3′方向的第4和6位的胞嘧啶C可被脱氨替换成T或G;对OsSERK2的NGA PAM靶点的编辑效率为50.00%。其靶核苷酸序列5′到3′方向的第2、3、7、10位的胞嘧啶C可被脱氨替换成T。腺嘌呤碱基编辑器rBE68能够识别NGA PAM完成靶碱基编辑,对OsSERK2的NGA PAM靶点的编辑效率为24.07%。本发明的基因编辑工具盒扩展了已有基因编辑工具盒的PAM序列,具有更宽更广的PAM识别序列,其能广泛地应用于水稻基因组中靶标基因的敲除或单碱基的定向突变,以此创制基因功能失活或获得性突变体材料。本发明不但提高了基因编辑效率,还扩展了单碱基编辑技术在植物中的编辑范围,这将对植物功能基因组学研究以及作物精准育种等方面具有重要的促进作用。尤其是碱基编辑系统在植物中的应用比通过同源重组修复的基因替换或通过非同源末端连接的基因插入更加有效和经济;而广泛的PAM序列使得实现任意位点碱基替换的可能性加大,为植物研究领域科研人员提供一个重要的基因功能研究工具,并在水稻基因功能研究和分子育种方向上为培育水稻新品种提供了新的策略。
附图说明
图1为pUbi-Cas9-AA、pENTR4-sgRNA和pUbi-Cas9-AA-sgRNA的载体图。
图2为Cas9-AA介导的水稻内源基因敲除的突变效果图。图中,ref为水稻参考基因组的相应序列,WT为未进行基因编辑的水稻粳稻品种Kitaake的相应序列,其余序列为突变株的相应序列。
图3为rBE66介导的水稻内源基因OsCOI2的胞嘧啶碱基编辑突变效果图。图中,ref为水稻参考基因组的相应序列,WT为未进行基因编辑的水稻粳稻品种Kitaake的相应序列,其余序列为突变株的相应序列。
图4为rBE66介导的水稻内源基因OsSERK2的胞嘧啶碱基编辑突变效果图。图中,ref为水稻参考基因组的相应序列,WT为未进行基因编辑的水稻粳稻品种Kitaake的相应序列,其余序列为突变株的相应序列。
图5为rBE68介导的水稻内源基因OsSERK2的腺嘌呤碱基编辑突变效果图。图中,ref为水稻参考基因组的相应序列,WT为未进行基因编辑的水稻粳稻品种Kitaake的相应序列,其余序列为突变株的相应序列。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中的pUbi-Cas9由发明人所在实验室保存并提供(H.Zhou,B.Liu,D.P.Weeks,M.H.Spalding&B.Yang.Large chromosomal deletions and heritable smallgenetic changes induced by CRISPR/Cas9 in rice.Nucleic Acids Res.2014,42(17):10903-10914)。公众可从发明人所在实验室获得该生物材料,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
实施例1、Cas9-AA在水稻中识别PAM序列的筛选鉴定
1、针对OsMPK3等16个基因的共20个靶标序列的设计和基因编辑载体构建
选取设计好的OsMPK3等16个基因的基因登录号和20个靶标序列(依据5′-N3-3′的形式,针对PAM中后两个位点进行四种碱基的组合,设计了16种PAM)信息见表1,这些基因的基因组序列均从水稻基因组数据库(https://rapdb.dna.affrc.go.jp/)中获得。将表1中各靶标序列(5′-N19-20PAM-3′)的正反向寡核苷酸链(具体序列见表1)委托生工生物工程(上海)股份有限公司人工合成后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链DNA片段(含有sgRNA的靶标序列中的5′-N19-20-3′),将双链DNA片段分别克隆到pENTR4-sgRNA(图1,含有attL1-sgRNA表达盒-attL2)载体的两个BtgZI或两个BsaI酶切位点中,引物U6p-F1(5′-AAGAACGAACTAAGCCGGAC-3′)测序确认插入片段完全正确后(插入片段含有sgRNA的靶标序列中的5′-N19-20-3′),将所得质粒经AatII酶切进行线性化,再通过Gateway的LR反应将sgRNA表达盒(含有sgRNA的编码DNA)分别克隆至植物表达载体pUbi-Cas9-AA(图1)的attR1-ccdB-attR2处,获得各靶标序列的基因编辑载体pUbi-Cas9-AA-sgRNA。pUbi-Cas9-AA-sgRNA是将pUbi-Cas9-AA的元件attR1-ccdB-attR2替换为attB1-sgRNA表达盒-attB2,保持pUbi-Cas9-AA的其它核苷酸不变得到的重组表达载体。共构建了20种基因编辑载体pUbi-Cas9-AA-sgRNA,这20种pUbi-Cas9-AA-sgRNA,区别仅在于attB1-sgRNA表达盒-attB2不同。attB1-sgRNA表达盒-attB2区别仅在于N19-20不同,表1中的双链DNA片段合成所需的寡核苷酸链中的大写字母即对应于attB1-sgRNA表达盒-attB2中的N19-20。共得到20种基因编辑载体pUbi-Cas9-AA-sgRNA,分别为靶向OsMPK8基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsMPK8;靶向OsMPK9基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsMPK9;靶向OsMPK10基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsMPK10;靶向OsMPK3基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsMPK3;靶向OsMPK4基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsMPK4;靶向基因OsCPK1的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK1;靶向OsCPK2基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK2;靶向OsCPK3基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK3;靶向OsCPK4基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK4;靶向OsCPK8基因中两个靶标序列的载体,分别命名为pUbi-Cas9-AA-sgRNA-OsCPK8-1和pUbi-Cas9-AA-sgRNA-OsCPK8-2;靶向OsCPK5基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK5;靶向OsCPK14基因中两个靶标序列的载体,分别命名为pUbi-Cas9-AA-sgRNA-OsCPK14-1和pUbi-Cas9-AA-sgRNA-OsCPK14-2;靶向OsCPK20基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK20;靶向OsCPK21基因中两个靶标序列的的载体,分别命名为pUbi-Cas9-AA-sgRNA-OsCPK21-1和pUbi-Cas9-AA-sgRNA-OsCPK21-2;靶向OsCPK27基因中两个靶标序列的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK27-1和pUbi-Cas9-AA-sgRNA-OsCPK27-2和靶向OsCPK28基因的载体,命名为pUbi-Cas9-AA-sgRNA-OsCPK28。
其中,植物表达载体pUbi-Cas9-AA的构建方法如下:在确定Cas9-AA的氨基酸序列(SEQ ID No.2第18-1384位)后,根据水稻密码子使用的偏好性对Cas9-AA基因的核苷酸序列进行密码子优化,在Cas9-AA基因5′和3′端各添加一个核定位信号NLS的水稻密码子优化后的编码核苷酸序列,组成嵌合基因NLS-Cas9-AA-NLS(如SEQ ID No.1所示)并委托生工生物工程(上海)股份有限公司完成4197bp的NLS-Cas9-AA-NLS基因(核苷酸序列是SEQ IDNo.1,编码链的编码序列(CDS)是SEQ ID No.1的第7-4191位)人工合成工作。将pUbi-Cas9的BamHI和BcuI识别位点间的小片段(Cas9)替换为SEQ ID No.1的第7-4191位所示的NLS-Cas9-AA-NLS基因,得到载体pUbi-Cas9-AA。SEQ ID No.1中,第1-6位为BamHI识别位点,第7-57位为NLS的CDS,第58-4158位为Cas9-AA的CDS,第4159-4188位为NLS的CDS,第4189-4191位为终止密码子TGA,第4192-4197位为BcuI识别位点。该过程中所用限制性内切酶BamHI和BcuI以及T4 DNA连接酶均购自赛默飞世尔科技(中国)有限公司,下同。载体pUbi-Cas9-AA的主要组成元件如下:RB T-DNA repeat序列(核苷酸序列为genbank登陆号为LC506530.1的第13973至第13997位,2020年3月20日)、attR1(核苷酸序列为genbank登陆号为KR233518.1的第2055至第2174位,2015年8月8日),ccdB表达盒(核苷酸序列为genbank登陆号为KR233518.1的第3289至第3594位,2015年8月8日),attR2(核苷酸序列为genbank登陆号为KR233518.1的第3635至第3759位,2015年8月8日),Ubip启动子(核苷酸序列是SEQID No.3),NLS-Cas9-AA-NLS基因(核苷酸序列为SEQ ID No.1的第7-4191位),NOS终止子(核苷酸序列是SEQ ID No.4),CaMV35S启动子(核苷酸序列为genbank登陆号为FJ362600.1的第10382至第11162位,2008年11月26日),潮霉素基因(核苷酸序列为genbank登陆号为KY420085.1,2017年7月11日),CaMV poly(A)终止子(核苷酸序列为genbank登陆号为MK896900.1的第8618至第8792位,2019年9月4日),LB T-DNA repeat(核苷酸序列为genbank登陆号为LC506530.1,第3569至第3593位,2020年3月20日)。
其中,pENTR4-sgRNA的构建方法如下:
按照从5′端到3′端的方向,将依次连接的U6启动子序列1、含有两个BtgZI酶切位点的核苷酸序列、sgRNA Scaffold序列、(T)8终止序列、U6启动子序列2、含有两个BsaI酶切位点的核苷酸序列、sgRNA Scaffold序列、(T)8终止序列组合sgRNA表达盒并委托委托生工生物工程(上海)股份有限公司进行人工合成。以公司合成的基因为模板,利用引物对(sgRNA-F:5′-GCAGGCTGTCGACTGGATCCAAGCTTAAGAACGAACTAAGCC-3′和sgRNA-R1:5′-CAAGAAAGCTGGGTGAATTCGATATCAAGCTTATCGATACCG-3′)扩增获得1kb的sgRNA表达盒片段(核苷酸序列是序列表中的序列SEQ ID No.9),以pENTR4(Invitrogen)载体为模板,用pENTR4-F1:(5′-CGAATTCACCCAGCTTTCTTGTACAAAGTTGGCATTATAAGA-3′)和pENTR4-R1:(5′-CTTAGTTCGTTCTTAAGCTTGGATCCAGTCGACAGCCTGCTTTTTTGTACAAAGT-3′)扩增2.2kb的pENTR4载体骨架(是将pENTR4的ccdB基因表达盒片段去除得到的DNA片段),借助试剂盒ClonExpress II OneStep Cloning Kit(购自南京诺唯赞生物科技股份有限公司)将sgRNA表达盒片段和pENTR4载体骨架进行infusion连接,获得载体pENTR4-sgRNA(图1)。其中的两个BtgZI或两个BsaI酶切位点用于克隆中特定基因的识别序列(sgRNA的靶标序列中的5′-N19-20-3′)。SEQ IDNo.9中,第27-348位为U6启动子序列1,第349-389位为含有两个BtgZI位点的核苷酸片段,第390-465位为sgRNA Scaffold序列,第466-473位为(T)8终止序列,第474-782位为U6启动子序列2,第783-806位为含有两个BsaI位点的核苷酸片段,第807-882位为sgRNA Scaffold序列,第883-890位为(T)8终止序列。
表1.Cas9-AA靶向各基因的靶标序列信息及其编辑效率
Figure BDA0002684250850000071
Figure BDA0002684250850000081
Figure BDA0002684250850000091
注:编辑效率中,分子为靶基因发生突变的T0代转基因水稻株数,分母为检测的T0代转基因水稻植株总数,括号中的数值为编辑效率。
2、农杆菌介导水稻稳定遗传转化
2.1水稻愈伤诱导:
将去壳的水稻粳稻品种Kitaake成熟种子用50%的商业化84消毒液处理45min;无菌水清洗3-5次,然后将种子转移至无菌的培养皿中,吸出多余的水份;将种子放置于MSD固体培养基(溶质为4.43g/L MS粉,30g/L蔗糖,2ml/L 2,4-D,8g/L植物凝胶;溶剂为水;pH5.7)上,于光照培养室培养10天,诱导愈伤组织形成;去除种子的胚和芽,将愈伤组织转移至新的MSD培养皿上,培养5天后用于农杆菌的转化。
2.2农杆菌转化:
将前述获得各靶核苷酸序列的20种基因编辑载体pUbi-Cas9-AA-sgRNA通过电击法分别转入农杆菌EHA105电击感受态细胞(购自北京博迈德基因技术有限公司)中。将所得农杆菌菌株在TY液体培养基(溶质为5g/L胰蛋白胨,3g/L酵母提取物;溶剂为水;pH7.0)中室温过夜培养12小时;离心收集农杆菌,用100μM乙酰丁香酮+MSD液体培养基(在MSD液体培养基中加入乙酰丁香酮至乙酰丁香酮的含量为100μM得到的液体培养基,MSD液体培养基的溶质为4.43g/L MS粉,30g/L蔗糖,2ml/L 2,4-D;溶剂为水;pH5.7)重悬,使其OD600nm=0.2待用。
2.3水稻愈伤的农杆菌侵染:
将愈伤组织分别置于上述农杆菌悬浮液中;浸泡30min后除去农杆菌悬浮液,将愈伤组织转移至无菌的吸水纸上除去多余的农杆菌菌液,再将愈伤组织转移至含有100μM乙酰丁香酮的MSD平板上,室温避光培养3天。
2.4水稻抗性愈伤筛选:
将暗培养后的愈伤组织转移至MSD筛选培养基(在MSD固体培养基中加入特美汀和潮霉素B至特美汀的含量为100mg/L和潮霉素B的含量为50mg/L得到的固体培养基)上培养,直至褐色旧愈伤组织表面出现鲜黄色抗性愈伤组织;每2周换一次培养基。
2.5抗性愈伤组织分化与生根:
将抗性愈伤组织转移至再生培养基上(溶质为4.43g/L MS粉,30g/L蔗糖,25g/L山梨醇,0.5mg/L NAA,3mg/L 6BA,100mg/L特美汀,50mg/L潮霉素B,12g/L琼脂粉;溶剂为水;pH=5.7),直至分化形成幼芽,期间每7-10天更换培养基;转移幼芽至1/2MS培养基(溶质为2.21g/L MS粉,15g/L蔗糖,8g/L植物凝胶;溶剂为水;pH5.7)中生根并长成幼苗,得到T0代转基因水稻。
2.6对T0代转基因水稻中各基因靶位点的编辑效率检测
提取T0代转基因水稻幼苗的基因组DNA。针对各基因的靶核苷酸序列,设计特异的PCR扩增引物并委托生工生物工程(上海)股份有限公司进人工合成,利用特异的PCR扩增引物对各材料的基因组DNA进行PCR扩增,PCR产物委托生工生物工程(上海)股份有限公司进行Sanger测序,分析编辑效率和突变类型。各基因的靶标序列的检测引物见表2。编辑效率为靶基因发生突变的T0代转基因水稻与得到的T0代转基因水稻的株数的比值。突变类型见图2。
对T0代植株的检测结果显示(见表1):在16种PAM类型(每种类型设计两个靶位点)中,检测到Cas9-AA能够识别NAN(NAG、NAA、NAT和NAC)、NGN(NGA、NGT、NGC和NGG)、NCG、NCT、NCC和NTC等PAM完成内源靶基因的敲除,编辑效率最高可达74.19%,这表明与野生型SpCas9识别NGG PAM相比,Cas9-AA的识别PAM序列更为灵活和编辑范围更广。
表2.Cas9-AA靶向各基因的靶标序列的检测引物
Figure BDA0002684250850000101
实施例2、水稻胞嘧啶碱基编辑器表达载体的构建
本实施例提供的水稻胞嘧啶碱基编辑器表达载体pUbi-rBE66,表达的胞嘧啶碱基编辑器是名称为rBE66的融合蛋白质(即Cas蛋白/胞嘧啶脱氨酶),由名称为hAID*Δ的胞嘧啶脱氨酶、名称为Cas9-AA(D10A)的Cas蛋白、名称为UGI的尿嘧啶DNA糖基化酶抑制剂和名称为NLS的核定位信号连接而成的蛋白质。rBE66的氨基酸序列是序列表中的SEQ ID No.6,第1-195位是hAID*Δ的氨基酸序列,第196-211位是连接肽的氨基酸序列,第212-1578位是Cas9-AA(D10A)的氨基酸序列,第1579-1669位是UGI的氨基酸序列,第1670-1676位是NLS的氨基酸序列。
实施例1中的Cas9-AA是双切口酶,将Cas9-AA(双切口酶)的第10位氨基酸残基由D替换为A(在组建融合蛋白质rBE66时,将Cas9-AA的第1位氨酸残基M去除,故而在融合蛋白质rBE66中体现为Cas9-AA部分的第9位氨基酸残基D替换为A),其它氨基酸残基不变得到单切口酶Cas9-AA(D10A)。Cas9-AA和Cas9-AA(D10A)识别的PAM相同,如能够识别NAN(NAG、NAA、NAT和NAC)、NGN(NGA、NGT、NGC和NGG)、NCG、NCT、NCC和NTC等PAM。
根据水稻密码子使用的偏好性对嵌合基因rBE66的核苷酸序列进行密码子优化,委托生工生物工程(上海)股份有限公司完成5043bp的rBE66基因(核苷酸序列是SEQ IDNo.5,编码链的编码序列(CDS)是SEQ ID No.5的第7-5037位)人工合成。将pUbi-Cas9-AA的BamHI和BcuI识别位点间的小片段(NLS-Cas9-AA-NLS)替换为SEQ ID No.5的第7-5037位所示的rBE66基因,得到rBE66基因表达载体pUbi-rBE66。SEQ ID No.5中,第1-6位为BamHI识别位点,第7-591位为hAID*Δ的CDS,第592-639位为连接肽的CDS,第640-4740位为Cas9-AA(D10A)的CDS,第4741-5013位为UGI的CDS,第5014-5034位为NLS的CDS,第5035-5037位为终止密码子TGA,第5038-5043位为BcuI识别位点。pUbi-rBE66中含有用于LR反应的元件attR1-ccdB-attR2。
实施例3、利用pUbi:rBE66对水稻内源基因的靶碱基进行C>T替换
OsCOI2(Os03g0265500)和OsSERK2(Os04g0457800)基因的基因组序列从水稻基因组数据库(https://rapdb.dna.affrc.go.jp/)中获得。
对于OsCOI2基因,选取“5′-GTCGACCCTGCACCAGTGGCGGC-3′”(OsCOI2基因靶标序列1,下划线为NGC PAM序列,其余序列为5′-N19-20-3′)和“5′-GAGCGCGTCGACCCTGCACCAG-3′”(OsCOI2基因靶标序列2,下划线为NAG PAM序列,其余序列为5′-N19-20-3′)作为sgRNA的靶核苷酸序列。为了制备针对OsCOI2基因靶标序列1的sgRNA,所需合成寡核苷酸链分别为gOsCOI2-F7(5′-gtgtGTCGACCCTGCACCAGTGGC-3′)/gOsCOI2-R7(5′-aaacGCCACTGGTGCAGGGTCGAC-3′),为了制备针对OsCOI2基因靶标序列2的sgRNA,所需合成寡核苷酸链分别为gOsCOI2-F8(5′-gtgtgGAGCGCGTCGACCCTGCAC-3′)/gOsCOI2-R8(5′-aaacGTGCAGGGTCGACGCGCTCc-3′),小写字母均为pENTR4-sgRNA载体经BsaI酶切产生的粘性末端,大写字母对应于sgRNA的靶核苷酸序列中的5′-N19-20-3′。对于OsSERK2基因,为了制备针对OsSERK2基因靶标序列1的sgRNA,选取“5′-GCCGGACAGCTCCATTGCCCGGA-3′”(下划线为NGA PAM序列,其余序列为5′-N19-20-3′)作为sgRNA的靶核苷酸序列,所需合成寡核苷酸链为gOsSERK2-F6(5′-tgttGCCGGACAGCTCCATTGCCC-3′)和gOsSERK2-R6(5′-aaacGGGCAATGGAGCTGTCCGGC-3′),小写字母均为pENTR4-sgRNA载体经BtgZI酶切产生的粘性末端,大写字母对应于sgRNA的靶核苷酸序列中的5′-N19-20-3′)。将各靶标序列的正反向寡核苷酸链委托生工生物工程(上海)股份有限公司人工合成后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链DNA片段(含有sgRNA的靶标序列中的5′-N19-20-3′),将双链DNA片段分别克隆到分别克隆到实施例1的pENTR4-sgRNA载体的BtgZI或BsaI酶切位点中,引物U6p-F1(5′-AAGAACGAACTAAGCCGGAC-3′)测序确认插入片段完全正确后,得到含有元件attL1-sgRNA表达盒-attL2的重组表达载体,将所得含有元件attL1-sgRNA表达盒-attL2的重组表达载体经AatII酶切进行线性化,再通过Gateway的LR反应将sgRNA表达盒分别克隆至pUbi-rBE66中的attR1-ccdB-attR2处,获得各靶标序列的3种碱基编辑载体pUbi-rBE66-sgRNA。
pUbi-rBE66-sgRNA是将pUbi-rBE66的attR1-ccdB-attR2替换为attB1-sgRNA表达盒-attB2(该attB1-sgRNA表达盒-attB2中,除了sgRNA的编码DNA中的5′-N19-20-3′与实施例1中的attB1-sgRNA表达盒-attB2不同外,其余核苷酸均相同),保持pUbi-rBE66的其它核苷酸不变得到的重组表达载体。pUbi-rBE66-sgRNA分别命名为pUbi-rBE66-sgRNA-OsCOI2-1(表达rBE66和针对OsCOI2基因靶标序列1的sgRNA),pUbi-rBE66-sgRNA-OsCOI2-2(表达rBE66和针对OsCOI2基因靶标序列2的sgRNA),pUbi-rBE66-sgRNA-OsSERK2(表达rBE66和针对OsSERK2基因靶标序列的sgRNA)。
pUbi-rBE66-sgRNA具有含Cas蛋白+脱氨酶表达盒(表达rBE66)和sgRNA表达盒(表达针对目的基因靶标序列的sgRNA)。该含Cas蛋白+脱氨酶表达盒由Ubip启动子(核苷酸序列是SEQ ID No.3),rBE66基因(即Cas蛋白/胞嘧啶脱氨酶的编码基因,其编码链的CDS是序列表中的SEQ ID No.5)和NOS终止子(核苷酸序列是SEQ ID No.4)连接而成。
将上述获得的碱基编辑载体pUbi-rBE66-sgRNA-OsCOI2-1、pUbi-rBE66-sgRNA-OsCOI2-2和pUbi-rBE66-sgRNA-OsSERK2分别经转化农杆菌EHA105后再进行水稻粳稻品种Kitaake的农杆菌遗传转化和基因组DNA提取检测,具体操作同实施例1的相应操作,获得T0代转基因水稻,即T0代转pUbi-rBE66-sgRNA-OsCOI2-1水稻、T0代转pUbi-rBE66-sgRNA-OsCOI2-2水稻和T0代转pUbi-rBE66-sgRNA-OsSERK2水稻。
分别提取T0代转pUbi-rBE66-sgRNA-OsCOI2-1水稻和T0代转pUbi-rBE66-sgRNA-OsCOI2-2水稻的基因组DNA作为模板,利用特异扩增引物(OsCOI2-F1:5′-CAACTTCCGCTTTTTCCTTG-3′和OsCOI2-R1:5′-TTGAACGAGGAGAGCATGTG-3′)进行PCR扩增OsCOI2基因,并将PCR扩增产物委托生工生物工程(上海)股份有限公司进行Sanger测序。提取T0代转pUbi-rBE66-sgRNA-OsSERK2水稻的基因组DNA作为模板,利用特异扩增引物(OsSERK2-F4:5′-GCACGCATGACTTAGCAAAA-3′和OsSERK2-R4:5′-CCTCCAGATTTGCCAGCTAT-3′)进行PCR扩增OsSERK2基因,并将PCR扩增产物委托生工生物工程(上海)股份有限公司进行Sanger测序。测序结果显示:基于Cas9-AA的胞嘧啶碱基编辑器rBE66能够识别NGC、NAG和NGA PAM(即NRN PAM,R为A或G)完成靶碱基编辑。对OsCOI2的NGC PAM靶点的靶碱基编辑效率为26.00%:检测的50株T0代转pUbi-rBE66-sgRNA-OsCOI2-1水稻中有13株的胞嘧啶C被脱氨替换成T或G,以C替换为T为主。靶标序列5′到3′方向的第3、6、7、8、11、13和14位的胞嘧啶C可被脱氨替换成T或G。其中,有3株的第3位胞嘧啶C(对应图3中的G3)被脱氨替换成T,有10株的第6位胞嘧啶C(对应图3中的G6)被脱氨替换成T,有1株的第6位胞嘧啶C(对应图3中的G6)被脱氨替换成G,有11株的第7位胞嘧啶C(对应图3中的G7)被脱氨替换成T,有1株的第7位胞嘧啶C(对应图3中的G7)被脱氨替换成G,有3株的第8位胞嘧啶C(对应图3中的G8)被脱氨替换成T,有4株的第11位胞嘧啶C(对应图3中的G11)被脱氨替换成T,有6株的第13位胞嘧啶C(对应图3中的G13)被脱氨替换成T,有1株的第14位胞嘧啶C(对应图3中的G14)被脱氨替换成T(图3和表3)。
基于Cas9-AA的胞嘧啶碱基编辑器rBE66对OsCOI2的NAG PAM靶点的靶碱基编辑效率为34.15%:检测的41株T0代转pUbi-rBE66-sgRNA-OsCOI2-2水稻中有14株的胞嘧啶C被脱氨替换成T或G,以C替换为T为主。靶标序列5′到3′方向的第4和6位的胞嘧啶C可被脱氨替换成T或G。其中,有12株的第4位胞嘧啶C(对应图3中的G4)被脱氨替换成T,有14株的第6位胞嘧啶C(对应图3中的G6)被脱氨替换成T,有1株的第4位胞嘧啶C(对应图3中的G4)被脱氨替换成G(图3和表3)。
基于Cas9-AA的胞嘧啶碱基编辑器rBE66对OsSERK2的NGA PAM靶点的编辑效率为50.00%:检测的52株T0代转pUbi-rBE66-sgRNA-OsSERK2水稻中有26株的胞嘧啶C被脱氨替换成T。其靶核苷酸序列5′到3′方向的第2、3、7、10位的胞嘧啶C可被脱氨替换成T或G,以C替换为T为主。其中,有3株的第2位胞嘧啶C(对应图4中的G2)被脱氨替换成T,有4株的第3位胞嘧啶C(对应图4中的G3)被脱氨替换成T,有20株的第7位胞嘧啶C(对应图4中的G7)被脱氨替换成T,有16株的第10位胞嘧啶C(对应图4中的G10)被脱氨替换成T,有1株的第7位胞嘧啶C(对应图4中的G7)被脱氨替换成G,有1株的第10位胞嘧啶C(对应图4中的G10)被脱氨替换成G(图4和表3)。
虽然本实施例中仅进行了rBE66对NGC、NAG和NGA PAM的碱基编辑效率的检测,但结合碱基编辑器的识别PAM序列是由其中的Cas蛋白所决定的,因此,结合实施例1中筛选鉴定出的Cas9-AA识别PAM,rBE66的建立将有利于扩展胞嘧啶碱基编辑技术在水稻中的应用范围。
实施例4、水稻腺嘌呤碱基编辑器表达载体的构建
本实施例提供的水稻腺嘌呤基编辑器表达载体pUbi-rBE68,表达的腺嘌呤基编辑器是名称为rBE68的融合蛋白质(即Cas蛋白/腺嘌呤脱氨酶),由名称为wtTadA的野生型腺嘌呤脱氨酶、名称为TadA7.10的突变型腺嘌呤脱氨酶、名称为Cas9-AA(D10A)的Cas蛋白和名称为NLS的核定位信号连接而成的蛋白质。rBE68的氨基酸序列是序列表中的SEQ IDNo.8。SEQ ID No.8中,第1-167位是wtTadA的氨基酸序列,第168-199位是连接肽的氨基酸序列,第200-365位是TadA7.10的氨基酸序列,第366-397位是连接肽的氨基酸序列,第398-1764位是Cas9-AA(D10A)的氨基酸序列,第1765-1774位是NLS的氨基酸序列。
根据水稻密码子使用的偏好性对嵌合基因rBE68基因的核苷酸序列进行密码子优化,委托生工生物工程(上海)股份有限公司完成5337bp的rBE68基因人工合成工作。将pUbi-Cas9-AA的BamHI和BcuI识别位点间的小片段(NLS-Cas9-AA-NLS)替换为SEQ ID No.7的第7-5331位所示的rBE68基因,得到rBE68基因表达载体pUbi-rBE68。SEQ ID No.7中,第1-6位为BamHI识别位点,第7-507位为wtTadA的CDS,第508-603位为连接肽的CDS,第604-1101位为TadA7.10的CDS,第1102-1197位为连接肽的CDS,第1198-5298位为Cas9-AA(D10A)的CDS,第5299-5328位为NLS的CDS,第5329-5331位为终止密码子TGA,第5332-5337位为BcuI识别位点。pUbi-rBE68中含有用于LR反应的元件attR1-ccdB-attR2。
实施例5、利用pUbi-rBE68对水稻内源基因的靶碱基进行A>G替换
本实施例中所用OsSERK2(Os04g0457800)基因的基因组序列可从水稻基因组数据库(https://rapdb.dna.affrc.go.jp/)中获得。对于OsSERK2基因,选取“5′-GCCGGACAGCTCCATTGCCCGGA-3′”(下划线为NGA PAM序列,其余序列为5′-N19-20-3′)作为sgRNA的靶核苷酸序列(靶标序列),为了制备针对OsSERK2基因靶标序列的sgRNA,所需合成寡核苷酸链为gOsSERK2-F6(5′-tgttGCCGGACAGCTCCATTGCCC-3′)和gOsSERK2-R6(5′-aaacGGGCAATGGAGCTGTCCGGC-3′),小写字母均为pENTR4-sgRNA载体经BtgZI酶切产生的粘性末端,大写字母对应于sgRNA的靶核苷酸序列中的5′-N19-20-3′)。将寡核苷酸链gOsSERK2-F6和gOsSERK2-R6委托生工生物工程(上海)股份有限公司人工合成后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链DNA片段(含有sgRNA的靶标序列中的5′-N19-20-3′),将双链DNA片段分别克隆到pENTR4-sgRNA载体的BtgZI酶切位点中,引物U6p-F1(AAGAACGAACTAAGCCGGAC)测序确认插入片段完全正确(插入片段含有sgRNA的靶标序列中的5′-N19-20-3′)后,将所得质粒经AatII酶切进行线性化,再通过Gateway的LR反应将sgRNA表达盒分别克隆至pUbi-rBE68中,获得靶核苷酸序列的碱基编辑载体pUbi-rBE68-sgRNA-OsSERK2。pUbi-rBE68-sgRNA-OsSERK2是将pUbi-rBE68的attR1-ccdB-attR2替换为attB1-sgRNA表达盒-attB2(该attB1-sgRNA表达盒-attB2中,除了sgRNA的编码DNA中的5′-N19-20-3′与实施例1中的attB1-sgRNA表达盒-attB2不同外,其余核苷酸均相同),保持pUbi-rBE68的其它核苷酸不变得到的重组表达载体。
pUbi-rBE68-sgRNA-OsSERK2表达rBE68和针对OsSERK2基因靶标序列的sgRNA。
Ubi-rBE68-sgRNA-OsSERK2具有含Cas蛋白+脱氨酶表达盒(表达rBE68)和sgRNA表达盒(表达针对OsSERK2基因靶标序列的sgRNA)。该含Cas蛋白+脱氨酶表达盒由Ubip启动子(核苷酸序列是SEQ ID No.3),rBE68基因(即Cas蛋白/腺嘌呤脱氨酶的编码基因,其编码链的CDS是序列表中的SEQ ID No.7)和NOS终止子(核苷酸序列是SEQ ID No.4)连接而成。
将上述获得的碱基编辑载体pUbi-rBE68-sgRNA-OsSERK2经转化农杆菌EHA105后再进行水稻粳稻品种Kitaake的农杆菌遗传转化和基因组DNA提取检测,具体操作同实施例1的相应操作,得到T0代转基因水稻,即T0代转pUbi-rBE68-sgRNA-OsSERK2水稻。
提取T0代转pUbi-rBE68-sgRNA-OsSERK2水稻的基因组DNA作为模板,利用特异扩增引物(OsSERK2-F4:5′-GCACGCATGACTTAGCAAAA-3′和OsSERK2-R4:5′-CCTCCAGATTTGCCAGCTAT-3′)进行PCR扩增OsSERK2基因,并将PCR扩增产物委托生工生物工程(上海)股份有限公司进行Sanger测序。测序结果显示:基于Cas9-AA的腺嘌呤碱基编辑器rBE68能够识别NGA PAM完成靶碱基编辑,检测的54株T0代pUbi-rBE68-sgRNA-OsSERK2转基因水稻中,有13株材料检测到预期的靶碱基突变,其靶核苷酸序列5′到3′方向的第6位的腺嘌呤A(对应图5中的T6)可被脱氨替换成G,因此rBE68对OsSERK2的NGA PAM靶点的编辑效率为24.07%。虽然本实施例中仅进行了rBE68对NGA PAM的碱基编辑效率的检测,但结合碱基编辑器的识别PAM序列是由其中的Cas蛋白所决定的,因此,结合实施例二中筛选鉴定出的Cas9-AA识别PAM,rBE68的建立将有利于扩展腺嘌呤碱基编辑技术在水稻中的应用范围。
表3 rBE66和rBE68靶向各基因的靶核苷酸序列信息及其碱基编辑效率和突变类型
Figure BDA0002684250850000141
注:编辑效率中,分子为靶基因发生突变的T0代转基因水稻株数,分母为检测的T0代转基因水稻植株总数,括号中的数值为编辑效率。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国农业科学院植物保护研究所
<120>一套编辑范围扩展的水稻人工基因组编辑系统及其应用
<130> GNCFH202313
<160> 9
<170> PatentIn version 3.5
<210> 1
<211> 4197
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 1
ggatccatgg cacctaagaa gaaaaggaaa gtcggcattc atggcgttcc ggcagccgac 60
aaaaagtata gcatcggcct cgatattggg acaaactctg tgggctgggc ggtaattacc 120
gacgagtaca aggtgcctag taagaaattt aaagtgctcg gaaacactga caggcactct 180
ataaagaaga acctgatcgg ggcactgctt ttcgactccg gagagacggc ggagaggacg 240
cgtctcaagc gtaccgcgcg ccgcaggtac acaagaagga agaataggat ctgctacttg 300
caggaaatct tcagtaacga gatggcgaag gtcgacgata gtttctttca tcggttggaa 360
gaatcgttcc tcgtagagga ggacaaaaag cacgagcgtc acccaatatt cgggaatatt 420
gttgacgagg ttgcctacca tgagaaatat cctacaatat atcacctccg taagaagctt 480
gtcgattcaa ctgataaggc tgatctcaga ctcatctatc ttgccctcgc acatatgatt 540
aagtttcgtg gccacttctt gattgaaggc gacctcaacc cggacaactc agatgttgac 600
aagcttttta tacagctcgt ccagacatat aaccagctgt ttgaagagaa tcccatcaat 660
gcgagtgggg ttgatgctaa agccattttg tccgccaggt tgtccaaatc tcgcagactg 720
gaaaacctga tcgcacagct tcccggtgaa aagaaaaacg ggctcttcgg caatctcatc 780
gcactgtccc tcggcctcac cccaaacttc aagtctaact tcgacctggc cgaggatgcg 840
aagctccagc tgtcaaaaga tacatacgac gacgatttgg acaatctgct tgcgcaaata 900
ggcgaccagt atgcggacct gttcctggct gccaaaaatc tgtcagatgc aatcctcctg 960
tccgatatat tgcgtgtgaa caccgaaatc acgaaggcac cgcttagcgc atccatgatc 1020
aagagatacg acgagcacca tcaggacctc acactcctca aggcgcttgt tcgtcagcag 1080
cttcccgaga aatataagga aatttttttc gatcaaagca agaatggata tgctggctat 1140
attgacggtg gcgcttcgca ggaggagttc tataaattca ttaagccgat tctggagaag 1200
atggacggaa cggaggagct cctcgtcaag cttaaccggg aagacctgtt gcggaagcag 1260
aggacttttg ataacggctc tattccgcac caaatccatc tgggtgagtt gcacgcaatc 1320
ttgagaagac aagaggattt ctacccgttc cttaaggata acagagagaa gatagaaaaa 1380
atactgacct tcaggatacc atactatgtg ggcccactgg cgcgcggaaa tagtcgtttc 1440
gcatggatga ctagaaagtc cgaagaaacg atcacgccat ggaattttga ggaagtggtc 1500
gacaagggcg cctctgccca gagcttcatc gaaaggatga ccaattttga caaaaatctg 1560
cctaacgaaa aggtgcttcc gaagcacagc ctgttgtatg aatacttcac agtttataac 1620
gagctcacta aggtcaagta cgtcacggag ggcatgcgta agcctgcttt cctgtctggt 1680
gaacaaaaaa aggcgattgt ggacctcctt ttcaagacga accgtaaagt tactgtgaag 1740
caactgaaag aggattactt taagaaaatt gagtgcttcg acagtgtgga gatttccggt 1800
gtcgaggacc ggtttaacgc cagcctgggt acgtatcatg acctgcttaa aattatcaag 1860
gataaagatt tcctggataa tgaagagaac gaagatatac tggaggacat tgtgttgact 1920
ttgaccctct tcgaggacag agagatgatt gaggaaagac tgaagaccta cgcacacctt 1980
tttgatgaca aggtcatgaa acaactcaag cgccggcgct atactggctg gggccggctt 2040
tctcgcaagc tcatcaatgg gattcgggat aagcaatcag gcaagacaat tttggacttc 2100
ctcaaatccg acggattcgc aaataggaat tttatgcagc tgatacatga cgactctttg 2160
acattcaaag aagacataca gaaggctcag gtctccggcc aaggagattc tttgcacgag 2220
catatcgcta acttggcagg tagccccgcc ataaaaaagg gcattcttca aacggtaaaa 2280
gttgttgacg aactcgtgaa ggttatgggc cgtcataagc cggaaaacat tgttattgaa 2340
atggctaggg aaaatcagac gacccagaag ggacagaaaa atagcaggga gcggatgaag 2400
agaattgaag agggaattaa ggagcttgga tctcagattc ttaaggagca ccctgtggag 2460
aacacccaac ttcagaatga aaagctctac ctttactacc ttcaaaacgg ccgggatatg 2520
tacgtcgatc aggaacttga cattaaccgg ttgagcgatt atgacgttga ccatattgtg 2580
ccccaatctt tccttaaaga cgactctatc gacaataaag tgctgacgcg cagcgataaa 2640
aatcgcggta agtcggataa tgtcccgtcg gaagaggtgg ttaaaaaaat gaagaactat 2700
tggaggcaac tcctgaatgc caagctgatc actcagagga aattcgacaa tctcaccaag 2760
gcagaaaggg gtggacttag cgagctcgac aaggccggtt ttatcaaaag acagctggtg 2820
gagacacgcc aaatcaccaa acacgttgcc cagatcctgg attcgaggat gaacacgaag 2880
tatgacgaga acgacaagtt gattagggaa gtcaaggtca tcactttgaa gtccaagctg 2940
gtgagcgact ttcgcaaaga cttccagttt tacaaagtca gggaaattaa taactaccac 3000
cacgcccacg acgcctacct taacgccgtg gttggcacag cactcatcaa gaaataccct 3060
aagctcgaat ctgagttcgt ctatggcgac tataaggtct acgacgttag aaaaatgatc 3120
gcgaaatctg agcaggaaat aggcaaggca actgccaagt acttcttcta ttccaatatc 3180
atgaactttt ttaagacgga gattaccctg gcgaatggtg agatccgcaa gcgccctttg 3240
attgagacaa acggagaaac aggagagatc gtatgggaca aagggcggga ctttgctact 3300
gttaggaagg tgctctctat gccacaagtt aacattgtca aaaaaactga agtgcagaca 3360
ggtgggttta gcaaggaatc tatcaggccg aagaggaact ctgacaagct gatcgcccgc 3420
aagaaagatt gggacccgaa aaagtacgga ggattcttgt ggcccacagt tgcgtactcc 3480
gtgcttgtcg tggccaaagt ggagaagggc aagtctaaga agctcaagag cgtcaaagag 3540
ttgttgggga tcacgattat ggagcggtcg tctttcgaaa agaatccgat agattttctc 3600
gaggccaagg gttataaaga agtcaagaag gatcttatca tcaagctccc taagtactcc 3660
ctctttgagc ttgaaaacgg acggaaaaga atgctggctt cagcgaagca gcttcagaag 3720
ggtaatgaac tcgctctgcc ctcaaaatat gtgaatttcc tttacctggc atcacactat 3780
gagaagctta aggggtctcc agaggacaac gagcagaagc aactgttcgt tgaacaacac 3840
aagcactacc ttgacgagat tatcgagcaa atcagcgagt ttagcaagcg cgttatactg 3900
gcagacgcaa atcttgataa ggtccttagc gcctacaaca agcatagaga caaacccatc 3960
cgggagcagg ccgagaacat tattcatctc ttcaccttga cgaggcttgg ggccccgaga 4020
gcgttcaagt acttcgatac taccatagac ccaaagcaat atcggtcgac aaaggaagtt 4080
cttgacgcca cgctgatcca ccaaagtata acaggcctct atgagacacg catcgacctt 4140
tcgcagttgg gcggtgaccg ccccaaaaag aagaggaaag ttggcgggtg aactagt 4197
<210> 2
<211> 1394
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 2
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Arg Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Leu Trp Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Lys Gln Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Arg Leu Gly Ala Pro Arg
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Pro Lys Gln Tyr Arg
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Arg Pro Lys Lys Lys Arg Lys Val Gly Gly
1385 1390
<210> 3
<211> 1765
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 3
gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 60
aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 120
acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 180
gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 240
gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 300
aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 360
gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 420
aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 480
gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 540
gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 600
aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 660
gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 720
ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 780
ggcctcctcc tcctctcacg gcacggcagc tacgggggat tcctttccca ccgctccttc 840
gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct ctttccccaa 900
cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc cacccgtcgg 960
cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta ccttctctag 1020
atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat gtttgtgtta 1080
gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg acctgtacgt 1140
cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct gggatggctc 1200
tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc atagggtttg 1260
gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc 1320
atgctttttt tttgtcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 1380
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 1440
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 1500
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 1560
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 1620
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 1680
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 1740
cctgttgttt ggtgttactt ctgca 1765
<210> 4
<211> 253
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60
atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120
atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180
gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240
atgttactag atc 253
<210> 5
<211> 5043
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
ggatccatgg atagccttct catgaacaga agagagtttc tctatcagtt taaaaatgtt 60
cggtgggcga aggggaggag agagacatat ctctgctatg ttgttaagcg gagagattct 120
gcgacctcat tctcactcga ttttggttat ttgaggaaca agaatggatg tcatgtcgaa 180
ttgttgtttc tccggtatat ttccgactgg gatttggacc cagggcggtg ttaccgggtc 240
acatggttta tttcctggag tccatgttac gactgtgcgc gccatgtcgc cgacttcctc 300
aggggtaatc ctaacttgtc cttgcggatt tttacagcca gactctattt ctgtgaggat 360
cggaaggcgg aacccgaggg gctgagaaga ctgcaccgcg ctggcgtcca aatcgccatc 420
atgactttta aggattattt ctactgttgg aacacgttcg tcgagaacca cggtcggacc 480
ttcaaagcct gggaagggct gcatgaaaat tccgtgaggt tgtcccggca actccgcaga 540
atactcctgc ccctttatga ggtcgacgat ctcagagacg cctttagaac tagcggaagc 600
gagacgccag ggacttctga atcggccacc cccgagagcg ataaaaagta ttcaatcgga 660
cttgctattg ggacaaactc tgtgggctgg gcggtaatta ccgacgagta caaggtgcct 720
agtaagaaat ttaaagtgct cggaaacact gacaggcact ctataaagaa gaacctgatc 780
ggggcactgc ttttcgactc cggagagacg gcggagagga cgcgtctcaa gcgtaccgcg 840
cgccgcaggt acacaagaag gaagaatagg atctgctact tgcaggaaat cttcagtaac 900
gagatggcga aggtcgacga tagtttcttt catcggttgg aagaatcgtt cctcgtagag 960
gaggacaaaa agcacgagcg tcacccaata ttcgggaata ttgttgacga ggttgcctac 1020
catgagaaat atcctacaat atatcacctc cgtaagaagc ttgtcgattc aactgataag 1080
gctgatctca gactcatcta tcttgccctc gcacatatga ttaagtttcg tggccacttc 1140
ttgattgaag gcgacctcaa cccggacaac tcagatgttg acaagctttt tatacagctc 1200
gtccagacat ataaccagct gtttgaagag aatcccatca atgcgagtgg ggttgatgct 1260
aaagccattt tgtccgccag gttgtccaaa tctcgcagac tggaaaacct gatcgcacag 1320
cttcccggtg aaaagaaaaa cgggctcttc ggcaatctca tcgcactgtc cctcggcctc 1380
accccaaact tcaagtctaa cttcgacctg gccgaggatg cgaagctcca gctgtcaaaa 1440
gatacatacg acgacgattt ggacaatctg cttgcgcaaa taggcgacca gtatgcggac 1500
ctgttcctgg ctgccaaaaa tctgtcagat gcaatcctcc tgtccgatat attgcgtgtg 1560
aacaccgaaa tcacgaaggc accgcttagc gcatccatga tcaagagata cgacgagcac 1620
catcaggacc tcacactcct caaggcgctt gttcgtcagc agcttcccga gaaatataag 1680
gaaatttttt tcgatcaaag caagaatgga tatgctggct atattgacgg tggcgcttcg 1740
caggaggagt tctataaatt cattaagccg attctggaga agatggacgg aacggaggag 1800
ctcctcgtca agcttaaccg ggaagacctg ttgcggaagc agaggacttt tgataacggc 1860
tctattccgc accaaatcca tctgggtgag ttgcacgcaa tcttgagaag acaagaggat 1920
ttctacccgt tccttaagga taacagagag aagatagaaa aaatactgac cttcaggata 1980
ccatactatg tgggcccact ggcgcgcgga aatagtcgtt tcgcatggat gactagaaag 2040
tccgaagaaa cgatcacgcc atggaatttt gaggaagtgg tcgacaaggg cgcctctgcc 2100
cagagcttca tcgaaaggat gaccaatttt gacaaaaatc tgcctaacga aaaggtgctt 2160
ccgaagcaca gcctgttgta tgaatacttc acagtttata acgagctcac taaggtcaag 2220
tacgtcacgg agggcatgcg taagcctgct ttcctgtctg gtgaacaaaa aaaggcgatt 2280
gtggacctcc ttttcaagac gaaccgtaaa gttactgtga agcaactgaa agaggattac 2340
tttaagaaaa ttgagtgctt cgacagtgtg gagatttccg gtgtcgagga ccggtttaac 2400
gccagcctgg gtacgtatca tgacctgctt aaaattatca aggataaaga tttcctggat 2460
aatgaagaga acgaagatat actggaggac attgtgttga ctttgaccct cttcgaggac 2520
agagagatga ttgaggaaag actgaagacc tacgcacacc tttttgatga caaggtcatg 2580
aaacaactca agcgccggcg ctatactggc tggggccggc tttctcgcaa gctcatcaat 2640
gggattcggg ataagcaatc aggcaagaca attttggact tcctcaaatc cgacggattc 2700
gcaaatagga attttatgca gctgatacat gacgactctt tgacattcaa agaagacata 2760
cagaaggctc aggtctccgg ccaaggagat tctttgcacg agcatatcgc taacttggca 2820
ggtagccccg ccataaaaaa gggcattctt caaacggtaa aagttgttga cgaactcgtg 2880
aaggttatgg gccgtcataa gccggaaaac attgttattg aaatggctag ggaaaatcag 2940
acgacccaga agggacagaa aaatagcagg gagcggatga agagaattga agagggaatt 3000
aaggagcttg gatctcagat tcttaaggag caccctgtgg agaacaccca acttcagaat 3060
gaaaagctct acctttacta ccttcaaaac ggccgggata tgtacgtcga tcaggaactt 3120
gacattaacc ggttgagcga ttatgacgtt gaccatattg tgccccaatc tttccttaaa 3180
gacgactcta tcgacaataa agtgctgacg cgcagcgata aaaatcgcgg taagtcggat 3240
aatgtcccgt cggaagaggt ggttaaaaaa atgaagaact attggaggca actcctgaat 3300
gccaagctga tcactcagag gaaattcgac aatctcacca aggcagaaag gggtggactt 3360
agcgagctcg acaaggccgg ttttatcaaa agacagctgg tggagacacg ccaaatcacc 3420
aaacacgttg cccagatcct ggattcgagg atgaacacga agtatgacga gaacgacaag 3480
ttgattaggg aagtcaaggt catcactttg aagtccaagc tggtgagcga ctttcgcaaa 3540
gacttccagt tttacaaagt cagggaaatt aataactacc accacgccca cgacgcctac 3600
cttaacgccg tggttggcac agcactcatc aagaaatacc ctaagctcga atctgagttc 3660
gtctatggcg actataaggt ctacgacgtt agaaaaatga tcgcgaaatc tgagcaggaa 3720
ataggcaagg caactgccaa gtacttcttc tattccaata tcatgaactt ttttaagacg 3780
gagattaccc tggcgaatgg tgagatccgc aagcgccctt tgattgagac aaacggagaa 3840
acaggagaga tcgtatggga caaagggcgg gactttgcta ctgttaggaa ggtgctctct 3900
atgccacaag ttaacattgt caaaaaaact gaagtgcaga caggtgggtt tagcaaggaa 3960
tctatcaggc cgaagaggaa ctctgacaag ctgatcgccc gcaagaaaga ttgggacccg 4020
aaaaagtacg gaggattctt gtggcccaca gttgcgtact ccgtgcttgt cgtggccaaa 4080
gtggagaagg gcaagtctaa gaagctcaag agcgtcaaag agttgttggg gatcacgatt 4140
atggagcggt cgtctttcga aaagaatccg atagattttc tcgaggccaa gggttataaa 4200
gaagtcaaga aggatcttat catcaagctc cctaagtact ccctctttga gcttgaaaac 4260
ggacggaaaa gaatgctggc ttcagcgaag cagcttcaga agggtaatga actcgctctg 4320
ccctcaaaat atgtgaattt cctttacctg gcatcacact atgagaagct taaggggtct 4380
ccagaggaca acgagcagaa gcaactgttc gttgaacaac acaagcacta ccttgacgag 4440
attatcgagc aaatcagcga gtttagcaag cgcgttatac tggcagacgc aaatcttgat 4500
aaggtcctta gcgcctacaa caagcataga gacaaaccca tccgggagca ggccgagaac 4560
attattcatc tcttcacctt gacgaggctt ggggccccga gagcgttcaa gtacttcgat 4620
actaccatag acccaaagca atatcggtcg acaaaggaag ttcttgacgc cacgctgatc 4680
caccaaagta taacaggcct ctatgagaca cgcatcgacc tttcgcagtt gggcggtgac 4740
tccggcggaa gtacaaacct ttcagacatt atagaaaagg aaaccggcaa gcaactcgtc 4800
atccaggaat ccatacttat gctccctgaa gaggtggaag aagtgatcgg taataaacca 4860
gagagcgaca tacttgtcca caccgcttat gacgaaagta cagacgaaaa cgtcatgctt 4920
ctgacgagtg atgcccccga atacaaacct tgggcgctcg tcatccagga ttccaatggg 4980
gagaataaaa taaagatgct ctctggaggc agcccaaaga agaagagaaa ggtctgaact 5040
agt 5043
<210> 6
<211> 1676
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 6
Met Asp Ser Leu Leu Met Asn Arg Arg Glu Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Gly Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
195 200 205
Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn
210 215 220
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
225 230 235 240
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
245 250 255
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Arg Thr
260 265 270
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
275 280 285
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
290 295 300
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
305 310 315 320
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
325 330 335
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
340 345 350
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
355 360 365
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
370 375 380
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
385 390 395 400
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
405 410 415
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
420 425 430
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
435 440 445
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
450 455 460
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
465 470 475 480
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
485 490 495
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
500 505 510
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
515 520 525
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
530 535 540
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
545 550 555 560
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
565 570 575
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
580 585 590
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
595 600 605
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
610 615 620
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
625 630 635 640
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
645 650 655
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
660 665 670
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
675 680 685
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
690 695 700
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
705 710 715 720
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
725 730 735
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
740 745 750
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
755 760 765
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
770 775 780
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
785 790 795 800
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
805 810 815
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
820 825 830
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
835 840 845
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
850 855 860
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
865 870 875 880
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
885 890 895
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
900 905 910
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
915 920 925
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
930 935 940
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
945 950 955 960
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
965 970 975
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
980 985 990
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
995 1000 1005
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
1010 1015 1020
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
1025 1030 1035
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro
1040 1045 1050
Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
1055 1060 1065
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
1070 1075 1080
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn
1085 1090 1095
Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala
1100 1105 1110
Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys
1115 1120 1125
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
1130 1135 1140
Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys
1145 1150 1155
Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val
1160 1165 1170
Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile
1175 1180 1185
Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
1190 1195 1200
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
1205 1210 1215
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1220 1225 1230
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1235 1240 1245
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1250 1255 1260
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1265 1270 1275
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1280 1285 1290
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1295 1300 1305
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys
1310 1315 1320
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1325 1330 1335
Lys Lys Tyr Gly Gly Phe Leu Trp Pro Thr Val Ala Tyr Ser Val
1340 1345 1350
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1355 1360 1365
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1370 1375 1380
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1385 1390 1395
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1400 1405 1410
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Lys
1415 1420 1425
Gln Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1430 1435 1440
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1445 1450 1455
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1460 1465 1470
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1475 1480 1485
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1490 1495 1500
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1505 1510 1515
Ile Ile His Leu Phe Thr Leu Thr Arg Leu Gly Ala Pro Arg Ala
1520 1525 1530
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Pro Lys Gln Tyr Arg Ser
1535 1540 1545
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1550 1555 1560
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1565 1570 1575
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr
1580 1585 1590
Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
1595 1600 1605
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
1610 1615 1620
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
1625 1630 1635
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile
1640 1645 1650
Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly
1655 1660 1665
Ser Pro Lys Lys Lys Arg Lys Val
1670 1675
<210> 7
<211> 5337
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 7
ggatccatgt ccgaagtgga atttagccat gaatattgga tgcggcacgc cctcacgctt 60
gccaagagag cctgggatga gagggaggtt cccgtcggtg ccgtgttggt ccataacaac 120
agggtgattg gggaaggatg gaacagaccc attgggcgcc atgatccaac tgcccatgca 180
gagattatgg cgctcaggca aggggggttg gttatgcaaa actaccggct tattgacgca 240
accctgtatg tcacccttga accctgtgtt atgtgcgcgg gggccatgat acactctcgg 300
atagggcggg tggtgttcgg ggctcgggat gctaagaccg gagctgctgg ttccctcatg 360
gatgtcttgc atcatcctgg tatgaaccat agagtcgaga ttactgaagg cattctcgca 420
gacgaatgcg ctgcccttct ctcagatttc tttagaatgc gcagacagga aataaaggct 480
caaaaaaaag cacagagttc cacggattcc ggcgggtcga gcggtggcag ctccggctcc 540
gagacacccg gtacgagtga atccgctacg cccgaatcct cggggggaag ctctggaggc 600
tcatcagaag tcgagttctc ccatgagtat tggatgaggc acgccctcac tcttgcgaag 660
agggccaggg acgagaggga ggtgccggtc ggtgctgtcc tggtcttgaa taacagggtg 720
ataggcgaag gttggaacag ggctattggc cttcatgacc ctactgctca tgcggaaatc 780
atggcactta gacagggggg cctcgttatg caaaattacc gcctgatcga cgccactctt 840
tatgtcacat ttgaaccatg tgttatgtgt gcgggcgcta tgatccattc acgcataggt 900
cgcgtggttt ttggagttcg caacgcgaaa acaggggctg caggctctct gatggacgtt 960
ttgcactatc cgggaatgaa ccatagagtc gaaatcacag aagggatttt ggcagacgaa 1020
tgcgcggctc ttctttgtta ttttttcaga atgccccgcc aagtgtttaa tgctcaaaag 1080
aaagcgcaga gtagcacaga ctcgggggga tcttctgggg gctcgtctgg ttccgagact 1140
cccggaactt ccgagtcggc aacacctgaa tcctccggcg gctcttcggg cggatctgac 1200
aaaaaatact caattggtct ggctattggg acaaactctg tgggctgggc ggtaattacc 1260
gacgagtaca aggtgcctag taagaaattt aaagtgctcg gaaacactga caggcactct 1320
ataaagaaga acctgatcgg ggcactgctt ttcgactccg gagagacggc ggagaggacg 1380
cgtctcaagc gtaccgcgcg ccgcaggtac acaagaagga agaataggat ctgctacttg 1440
caggaaatct tcagtaacga gatggcgaag gtcgacgata gtttctttca tcggttggaa 1500
gaatcgttcc tcgtagagga ggacaaaaag cacgagcgtc acccaatatt cgggaatatt 1560
gttgacgagg ttgcctacca tgagaaatat cctacaatat atcacctccg taagaagctt 1620
gtcgattcaa ctgataaggc tgatctcaga ctcatctatc ttgccctcgc acatatgatt 1680
aagtttcgtg gccacttctt gattgaaggc gacctcaacc cggacaactc agatgttgac 1740
aagcttttta tacagctcgt ccagacatat aaccagctgt ttgaagagaa tcccatcaat 1800
gcgagtgggg ttgatgctaa agccattttg tccgccaggt tgtccaaatc tcgcagactg 1860
gaaaacctga tcgcacagct tcccggtgaa aagaaaaacg ggctcttcgg caatctcatc 1920
gcactgtccc tcggcctcac cccaaacttc aagtctaact tcgacctggc cgaggatgcg 1980
aagctccagc tgtcaaaaga tacatacgac gacgatttgg acaatctgct tgcgcaaata 2040
ggcgaccagt atgcggacct gttcctggct gccaaaaatc tgtcagatgc aatcctcctg 2100
tccgatatat tgcgtgtgaa caccgaaatc acgaaggcac cgcttagcgc atccatgatc 2160
aagagatacg acgagcacca tcaggacctc acactcctca aggcgcttgt tcgtcagcag 2220
cttcccgaga aatataagga aatttttttc gatcaaagca agaatggata tgctggctat 2280
attgacggtg gcgcttcgca ggaggagttc tataaattca ttaagccgat tctggagaag 2340
atggacggaa cggaggagct cctcgtcaag cttaaccggg aagacctgtt gcggaagcag 2400
aggacttttg ataacggctc tattccgcac caaatccatc tgggtgagtt gcacgcaatc 2460
ttgagaagac aagaggattt ctacccgttc cttaaggata acagagagaa gatagaaaaa 2520
atactgacct tcaggatacc atactatgtg ggcccactgg cgcgcggaaa tagtcgtttc 2580
gcatggatga ctagaaagtc cgaagaaacg atcacgccat ggaattttga ggaagtggtc 2640
gacaagggcg cctctgccca gagcttcatc gaaaggatga ccaattttga caaaaatctg 2700
cctaacgaaa aggtgcttcc gaagcacagc ctgttgtatg aatacttcac agtttataac 2760
gagctcacta aggtcaagta cgtcacggag ggcatgcgta agcctgcttt cctgtctggt 2820
gaacaaaaaa aggcgattgt ggacctcctt ttcaagacga accgtaaagt tactgtgaag 2880
caactgaaag aggattactt taagaaaatt gagtgcttcg acagtgtgga gatttccggt 2940
gtcgaggacc ggtttaacgc cagcctgggt acgtatcatg acctgcttaa aattatcaag 3000
gataaagatt tcctggataa tgaagagaac gaagatatac tggaggacat tgtgttgact 3060
ttgaccctct tcgaggacag agagatgatt gaggaaagac tgaagaccta cgcacacctt 3120
tttgatgaca aggtcatgaa acaactcaag cgccggcgct atactggctg gggccggctt 3180
tctcgcaagc tcatcaatgg gattcgggat aagcaatcag gcaagacaat tttggacttc 3240
ctcaaatccg acggattcgc aaataggaat tttatgcagc tgatacatga cgactctttg 3300
acattcaaag aagacataca gaaggctcag gtctccggcc aaggagattc tttgcacgag 3360
catatcgcta acttggcagg tagccccgcc ataaaaaagg gcattcttca aacggtaaaa 3420
gttgttgacg aactcgtgaa ggttatgggc cgtcataagc cggaaaacat tgttattgaa 3480
atggctaggg aaaatcagac gacccagaag ggacagaaaa atagcaggga gcggatgaag 3540
agaattgaag agggaattaa ggagcttgga tctcagattc ttaaggagca ccctgtggag 3600
aacacccaac ttcagaatga aaagctctac ctttactacc ttcaaaacgg ccgggatatg 3660
tacgtcgatc aggaacttga cattaaccgg ttgagcgatt atgacgttga ccatattgtg 3720
ccccaatctt tccttaaaga cgactctatc gacaataaag tgctgacgcg cagcgataaa 3780
aatcgcggta agtcggataa tgtcccgtcg gaagaggtgg ttaaaaaaat gaagaactat 3840
tggaggcaac tcctgaatgc caagctgatc actcagagga aattcgacaa tctcaccaag 3900
gcagaaaggg gtggacttag cgagctcgac aaggccggtt ttatcaaaag acagctggtg 3960
gagacacgcc aaatcaccaa acacgttgcc cagatcctgg attcgaggat gaacacgaag 4020
tatgacgaga acgacaagtt gattagggaa gtcaaggtca tcactttgaa gtccaagctg 4080
gtgagcgact ttcgcaaaga cttccagttt tacaaagtca gggaaattaa taactaccac 4140
cacgcccacg acgcctacct taacgccgtg gttggcacag cactcatcaa gaaataccct 4200
aagctcgaat ctgagttcgt ctatggcgac tataaggtct acgacgttag aaaaatgatc 4260
gcgaaatctg agcaggaaat aggcaaggca actgccaagt acttcttcta ttccaatatc 4320
atgaactttt ttaagacgga gattaccctg gcgaatggtg agatccgcaa gcgccctttg 4380
attgagacaa acggagaaac aggagagatc gtatgggaca aagggcggga ctttgctact 4440
gttaggaagg tgctctctat gccacaagtt aacattgtca aaaaaactga agtgcagaca 4500
ggtgggttta gcaaggaatc tatcaggccg aagaggaact ctgacaagct gatcgcccgc 4560
aagaaagatt gggacccgaa aaagtacgga ggattcttgt ggcccacagt tgcgtactcc 4620
gtgcttgtcg tggccaaagt ggagaagggc aagtctaaga agctcaagag cgtcaaagag 4680
ttgttgggga tcacgattat ggagcggtcg tctttcgaaa agaatccgat agattttctc 4740
gaggccaagg gttataaaga agtcaagaag gatcttatca tcaagctccc taagtactcc 4800
ctctttgagc ttgaaaacgg acggaaaaga atgctggctt cagcgaagca gcttcagaag 4860
ggtaatgaac tcgctctgcc ctcaaaatat gtgaatttcc tttacctggc atcacactat 4920
gagaagctta aggggtctcc agaggacaac gagcagaagc aactgttcgt tgaacaacac 4980
aagcactacc ttgacgagat tatcgagcaa atcagcgagt ttagcaagcg cgttatactg 5040
gcagacgcaa atcttgataa ggtccttagc gcctacaaca agcatagaga caaacccatc 5100
cgggagcagg ccgagaacat tattcatctc ttcaccttga cgaggcttgg ggccccgaga 5160
gcgttcaagt acttcgatac taccatagac ccaaagcaat atcggtcgac aaaggaagtt 5220
cttgacgcca cgctgatcca ccaaagtata acaggcctct atgagacacg catcgacctt 5280
tcgcagttgg gcggtgaccg ccccaaaaag aagaggaaag ttggcgggtg aactagt 5337
<210> 8
<211> 1774
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 8
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Arg Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Arg Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Leu Trp Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Lys Gln Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Arg
1700 1705 1710
Leu Gly Ala Pro Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Pro Lys Gln Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Arg Pro Lys Lys Lys Arg Lys Val Gly
1760 1765 1770
Gly
<210> 9
<211> 990
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 9
gcaggctgtc gactggatcc aagcttaaga acgaactaag ccggacaaaa aaaggagcac 60
atatacaaac cggttttatt catgaatggt cacgatggat gatggggctc agacttgagc 120
tacgaggccg caggcgagag aagcctagtg tgctctctgc ttgtttgggc cgtaacggag 180
gatacggccg acgagcgtgt actaccgcgc gggatgccgc tgggcgctgc gggggccgtt 240
ggatggggat cggtgggtcg cgggagcgtt gaggggagac aggtttagta ccacctcgcc 300
taccgaacaa tgaagaaccc accttataac cccgcgcgct gccgcttgtg ttggctagga 360
tccatcgcag tcagcgatga gtacagcaag ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt tttgagattt 480
ccaaccaggt ccctggagcc catagtctag taacggccgc cagtgtgctg gaattgccct 540
tggatcatga accaacggcc tggctgtatt tggtggttgt gtagggagat ggggagaaga 600
aaagcccgat tctcttcgct gtgatgggct ggatgcatgc gggggagcgg gaggcccaag 660
tacgtgcacg gtgagcggcc cacagggcga gtgtgagcgc gagaggcggg aggaacagtt 720
tagtaccaca ttgcccagct aactcgaacg cgaccaactt ataaacccgc gcgctgtcgc 780
ttgtgtagag accaaaggag gtctcagttt tagagctaga aatagcaagt taaaataagg 840
ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt gtcccttcga 900
agggcaattc tgcagatatc catcacactg gcggccgctc gaggtcgacg gtatcgataa 960
gcttgatatc gaattcaccc agctttcttg 990

Claims (10)

1.DNA分子在水稻单碱基编辑中的应用,所述DNA分子由含Cas蛋白+脱氨酶表达盒和sgRNA表达盒组成;所述含Cas蛋白+脱氨酶表达盒表达融合蛋白,所述融合蛋白含有Cas蛋白和脱氨酶,所述脱氨酶为胞嘧啶脱氨酶和/或腺嘌呤脱氨酶,所述Cas蛋白为氨基酸序列是SEQ ID No.6的第212-1578位的蛋白质;所述sgRNA表达盒表达sgRNA,所述sgRNA的靶标序列是5′-N19-20PAM-3′,所述N19-20为19-20个N,所述PAM为3个N;所述N为A、G、C或T。
2.根据权利要求1所述的应用,其特征在于:所述含Cas蛋白+脱氨酶表达盒为含Cas蛋白+胞嘧啶脱氨酶表达盒或含Cas蛋白+腺嘌呤脱氨酶表达盒;
所述含Cas蛋白+胞嘧啶脱氨酶表达盒表达名称为Cas蛋白/胞嘧啶脱氨酶的融合蛋白,所述Cas蛋白/胞嘧啶脱氨酶含有所述胞嘧啶脱氨酶、所述Cas蛋白和尿嘧啶DNA糖基化酶抑制剂;
所述含Cas蛋白+腺嘌呤脱氨酶表达盒表达名称为Cas蛋白/腺嘌呤脱氨酶的融合蛋白,所述Cas蛋白/腺嘌呤脱氨酶含有所述腺嘌呤脱氨酶和所述Cas蛋白。
3.根据权利要求2所述的应用,其特征在于:所述Cas蛋白/胞嘧啶脱氨酶是由所述胞嘧啶脱氨酶、所述Cas蛋白、所述尿嘧啶DNA糖基化酶抑制剂和核定位信号连接而成的蛋白质,
所述Cas蛋白/腺嘌呤脱氨酶是由所述腺嘌呤脱氨酶、所述Cas蛋白和所述核定位信号连接而成的蛋白质。
4.根据权利要求3所述的应用,其特征在于:所述Cas蛋白/胞嘧啶脱氨酶的氨基酸序列为序列表中的SEQ ID No.6,所述Cas蛋白/腺嘌呤脱氨酶的氨基酸序列为序列表中的SEQID No.8。
5.根据权利要求4所述的应用,其特征在于:所述含Cas蛋白+脱氨酶表达盒中含有所述Cas蛋白的编码基因,所述Cas蛋白的编码基因的编码链的编码序列是序列表中的SEQ IDNo.5的第640-4740位。
6.根据权利要求5所述的应用,其特征在于:所述含Cas蛋白+胞嘧啶脱氨酶表达盒含有所述Cas蛋白/胞嘧啶脱氨酶的编码基因,所述Cas蛋白/胞嘧啶脱氨酶的编码基因的编码链的编码序列是序列表中的SEQ ID No.5;
所述含Cas蛋白+腺嘌呤脱氨酶表达盒含有所述Cas蛋白/腺嘌呤脱氨酶的编码基因,所述Cas蛋白/腺嘌呤脱氨酶的编码基因的编码链的编码序列是序列表中的SEQ ID No.7。
7.根据权利要求1-6中任一所述的应用,其特征在于:所述PAM是下述任一种:
L1、5′-NAN-3′,
L2、5′-NGN-3′,
L3、5′-NCG-3′,
L4、5′-NCT-3′,
L5、5′-NCC-3′,
L6、5′-NTC-3′,
所述N为A、G、C或T。
8.与权利要求1-7中任一所述的DNA分子相关的生物材料,所述生物材料为下述任一种:
B1)权利要求1-7中任一所述的DNA分子;
B2)含有B1)所述DNA分子的重组载体;
B3)含有B1)所述DNA分子的重组微生物;
B4)含有B2)所述的重组载体的重组微生物;
B5)由权利要求1-7中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒和所述sgRNA表达盒组成的组合物;
B6)由含有权利要求1-7中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒的重组载体和含有权利要求1-7中任一所述的DNA分子中的所述sgRNA表达盒的重组载体组成的组合物;
B7)由含有权利要求1-7中任一所述的DNA分子中的所述Cas蛋白+脱氨酶表达盒的重组微生物和含有权利要求1-7中任一所述的DNA分子中的所述sgRNA表达盒的重组微生物组成的组合物;
B8)由权利要求1-7中任一所述的DNA分子中的所述融合蛋白和权利要求1-7中任一所述的DNA分子中的所述sgRNA组成的组合物。
9.权利要求1中所述的Cas蛋白、权利要求1-7中任一所述的DNA分子或权利要求8所述的生物材料在植物基因组编辑中的应用。
10.根据权利要求9所述的应用,其特征在于:所述植物为双子叶植物或单子叶植物。
CN202010971535.9A 2020-09-16 2020-09-16 一套编辑范围扩展的水稻人工基因组编辑系统及其应用 Pending CN112080513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010971535.9A CN112080513A (zh) 2020-09-16 2020-09-16 一套编辑范围扩展的水稻人工基因组编辑系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010971535.9A CN112080513A (zh) 2020-09-16 2020-09-16 一套编辑范围扩展的水稻人工基因组编辑系统及其应用

Publications (1)

Publication Number Publication Date
CN112080513A true CN112080513A (zh) 2020-12-15

Family

ID=73738017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010971535.9A Pending CN112080513A (zh) 2020-09-16 2020-09-16 一套编辑范围扩展的水稻人工基因组编辑系统及其应用

Country Status (1)

Country Link
CN (1) CN112080513A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114835818A (zh) * 2022-03-17 2022-08-02 江南大学 一种基因编辑融合蛋白、其构建的腺嘌呤碱基编辑器及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
CN110257424A (zh) * 2018-03-12 2019-09-20 广东赤萌医疗科技有限公司 一种定点编辑ccr5基因的方法
CN110527695A (zh) * 2019-03-07 2019-12-03 山东舜丰生物科技有限公司 一种用于基因定点突变的核酸构建物
CN112430612A (zh) * 2020-12-08 2021-03-02 安徽省农业科学院水稻研究所 一种高效切割的SpRY基因及其应用
US20210284978A1 (en) * 2020-01-24 2021-09-16 The General Hospital Corporation Unconstrained Genome Targeting with near-PAMless Engineered CRISPR-Cas9 Variants

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110257424A (zh) * 2018-03-12 2019-09-20 广东赤萌医疗科技有限公司 一种定点编辑ccr5基因的方法
CN110527695A (zh) * 2019-03-07 2019-12-03 山东舜丰生物科技有限公司 一种用于基因定点突变的核酸构建物
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
US20210284978A1 (en) * 2020-01-24 2021-09-16 The General Hospital Corporation Unconstrained Genome Targeting with near-PAMless Engineered CRISPR-Cas9 Variants
CN112430612A (zh) * 2020-12-08 2021-03-02 安徽省农业科学院水稻研究所 一种高效切割的SpRY基因及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BIN REN ET AL.: ""Cas9-NG Greatly Expands the Targeting Scope of the Genome-Editing Toolkit by Recognizing NG and Other Atypical PAMs in Rice"", 《MOLECULAR PLANT》 *
BIN REN ET AL.: ""Improved Base Editor for Efficiently Inducing Genetic Variations in Rice with CRISPR/Cas9- Guided Hyperactive hAID Mutant"", 《MOLECULAR PLANT》 *
RUSSELL T. WALTON ET AL.: ""Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants"", 《SCIENCE》 *
ZIYAN XU ET AL.: ""SpRY greatly expands the genome editing scope in rice with highly flexible PAM recognition"", 《BIORXIV》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114835818A (zh) * 2022-03-17 2022-08-02 江南大学 一种基因编辑融合蛋白、其构建的腺嘌呤碱基编辑器及其应用
CN114835818B (zh) * 2022-03-17 2024-03-22 江南大学 一种基因编辑融合蛋白、其构建的腺嘌呤碱基编辑器及其应用

Similar Documents

Publication Publication Date Title
CN109652422B (zh) 高效的单碱基编辑系统OsSpCas9-eCDA及其应用
US9756871B2 (en) TAL-mediated transfer DNA insertion
CN112143753A (zh) 一套腺嘌呤碱基编辑器及其相关生物材料与应用
CN112852791B (zh) 腺嘌呤碱基编辑器及其相关生物材料与应用
JP3431177B2 (ja) 習性及び収量において変更されたトランスジェニック植物を作製するプラスミド
CN110066824B (zh) 一套用于水稻的碱基编辑人工系统
AU2010257316B2 (en) Transformation Vectors
CN111116725B (zh) 基因Os11g0682000及其编码的蛋白在调控水稻白叶枯病抗性中的应用
KR20140130506A (ko) 사탕수수 바실루스형 바이러스 (scbv) 인핸서 및 식물 기능성 유전체학에서의 이의 용도
CN110643589B (zh) 一种提高植物抗旱性的蛋白及其应用
CN112250742B (zh) 蛋白质及其相关生物材料在调控植物机械强度中的用途
CN109929019B (zh) 一种与植物耐盐碱相关蛋白GsERF7及其编码基因与应用
US20140289899A1 (en) Sugarcane bacilliform viral (scbv) enhancer and its use in plant functional genomics
CN112080513A (zh) 一套编辑范围扩展的水稻人工基因组编辑系统及其应用
CN115466747B (zh) 糖基转移酶ZmKOB1基因及其在调控玉米雌穗结实性状或发育上的应用
CN111206040B (zh) 水稻白叶枯病抗性相关基因OsDuf6及其应用
CN107739403B (zh) 一种与植物开花期相关的蛋白及其编码基因与应用
KR20190122595A (ko) 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법
CN114752620B (zh) ZmGW3蛋白及其基因在调控玉米籽粒发育中的应用
US20230313212A1 (en) Plastid transformation by complementation of nuclear mutations
US20230392160A1 (en) Compositions and methods for increasing genome editing efficiency
WO2001064865A1 (fr) Promoteurs ameliores et utilisation de ceux-ci
AU5355399A (en) Early-maturing sugarcane with high sugar content

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination