CN113307878A - 一种融合蛋白及其应用 - Google Patents

一种融合蛋白及其应用 Download PDF

Info

Publication number
CN113307878A
CN113307878A CN202010120522.0A CN202010120522A CN113307878A CN 113307878 A CN113307878 A CN 113307878A CN 202010120522 A CN202010120522 A CN 202010120522A CN 113307878 A CN113307878 A CN 113307878A
Authority
CN
China
Prior art keywords
leu
lys
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010120522.0A
Other languages
English (en)
Inventor
牛小牧
李彦莎
梁亚峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shunfeng Biotechnology Co Ltd
Original Assignee
Shandong Shunfeng Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shunfeng Biotechnology Co Ltd filed Critical Shandong Shunfeng Biotechnology Co Ltd
Priority to CN202010120522.0A priority Critical patent/CN113307878A/zh
Priority to PCT/CN2021/077328 priority patent/WO2021169925A1/zh
Publication of CN113307878A publication Critical patent/CN113307878A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/485Exopeptidases (3.4.11-3.4.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/10Protein-tyrosine kinases (2.7.10)
    • C12Y207/10001Receptor protein-tyrosine kinase (2.7.10.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/11Aminopeptidases (3.4.11)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Abstract

本发明提供了一种融合蛋白及其应用。具体地,本发明提供了一种融合蛋白,其包括选自下列的组分,或由下列组分组成:(1)定位功能元件D1,其具有靶向和结合DNA的功能;和(2)去甲基化功能元件D2,其具有将甲基化核苷酸转化为非甲基化核苷酸的功能。本发明的去甲基化方法在植物中具有精准高效的去甲基化修饰效率,对研究植物的表观遗传学及通过去甲基化调控植物性状具有重要科学价值。

Description

一种融合蛋白及其应用
技术领域
本发明属于生物技术领域,具体涉及一种融合蛋白及其应用。
背景技术
DNA甲基化(DNA methylation)为DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表现,是真核细胞普遍存在的修饰方式。DNA甲基化的建立均是由DNA甲基化转移酶以S-腺苷甲硫氨酸(SAM)为甲基供体催化反应形成。
甲基化修饰有多种方式,被修饰位点的碱基可以是腺嘌呤的N-6位(6mA)、胞嘧啶的N-4位、鸟嘌呤的N-7位(7mG)和胞嘧啶的C-5位(5mC)。它们分别由不同的DNA甲基化酶催化。然而,研究的最清楚、最普遍的还是5mC即胞嘧啶C-5位的甲基化。
甲基化的DNA可以发生去甲基化。DNA的去甲基化存在被动去甲基化和主动去甲基化两种机制。被动去甲基化与DNA半保留复制有关。因为DNA复制产生的新链是没有DNA甲基化的,如果甲基化的维持系统没有工作,这样就导致了DNA去甲基化的发生,很明显这是一个被动的过程。主动去甲基化与DNA去甲基化酶催化有关。例如,TET1(ten-eleventranslocation 1)和ROS1(repressor of silencing 1)分别是动物和植物的去甲基化酶,它们都不能直接移除胞嘧啶C-5位上的甲基,均是通过碱基错配修复的机制引入一个新的没有修饰的胞嘧啶。
研究表明,DNA去甲基化对于沉默基因的重新激活起着重要作用。并且,DNA的甲基化可以导致某些区域DNA构象变化,从而影响蛋白与DNA的相互作用,导致基因沉默。在植物中,DNA甲基化控制多种生物过程,其中包括花形态、性别决定、植物结构、开花时间、生物量和叶片衰老等。通过控制DNA的甲基化可实现对生物体表观遗传性状的操控。因此,开发靶向核酸甲基化或去甲基化工具,对于甲基化功能的研究和表观遗传育种具有重要的科学价值。
因此,本领域迫切需要开发出一种能够一种高效、定点地对DNA进行甲基化或去甲基化修饰的方法。
发明内容
本发明提供一种高效、定点地对核酸进行去甲基化修饰的蛋白及其应用。
在本发明的第一方面,提供了一种融合蛋白,包括选自下列的组分:
(1)定位功能元件D1,其具有靶向和结合DNA的功能;和
(2)去甲基化功能元件D2,其具有将甲基化核苷酸转化为非甲基化核苷酸的功能。
在另一优选例中,所述D1元件无催化活性,并且选自下组:Cas蛋白、锌指蛋白或TALENs蛋白,或其功能结构域,或其组合。
在另一优选例中,所述D1元件选自下组:dCas9、dCpf1、dCas12、dCas13、dCms1、dMAD7,或其功能域,或其组合。
在另一优选例中,所述D1元件为dCas9。
在另一优选例中,所述D1元件包含选自下列的序列,或由选自下列的序列组成:
(1)SEQ ID NO:1所示的氨基酸序列;
(2)与SEQ ID NO:1所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸的置换、缺失或添加)的序列;或
(3)与SEQ ID NO:1所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
在另一优选例中,所述D2元件具有将甲基化胞嘧啶转换为非甲基化胞嘧啶的功能。
在另一优选例中,所述D2元件是选自下组的去甲基化酶或其去甲基化功能域:ROS1、TET、DME、DML,或其组合。
在另一优选例中,所述D2元件是ROS1或其功能域。
在另一优选例中,所述D2元件包含选自下列的序列,或由选自下列的序列组成:
(1)SEQ ID NO:3所示的氨基酸序列;
(2)SEQ ID NO:3所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸的置换、缺失或添加)的序列;或
(3)SEQ ID NO:3所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
在另一优选例中,所述的D1元件位于D2元件的N端或C端。
在另一优选例中,所述的D1元件和D2元件通过一个或多个下列组件连接:肽键、连接肽、核定位信号、表位标签,或其组合。
在另一优选例中,所述核定位信号,包含选自下列的序列,或由选自下列的序列组成:
(1)SEQ ID NO:5或SEQ ID NO:7所示的氨基酸序列;
(2)与SEQ ID NO:5或SEQ ID NO:7所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸的置换、缺失或添加)的序列;或
(3)与SEQ ID NO:5或SEQ ID NO:7所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
在另一优选例中,在所述的表位标签选自下组:His标签、GST标签、HA标签、c-Myc标签、Flag标签、V5标签,或其组合。
在另一优选例中,所述融合蛋白,包含选自下列的序列,或由选自下列的序列组成:
(1)SEQ ID NO:9所示的氨基酸序列;
(2)与SEQ ID NO:9所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸的置换、缺失或添加)的序列;或
(3)与SEQ ID NO:9所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
在另一优选例中,所述融合蛋白的N端或C端进一步包括以下一种或多种元件:表位标签、报告基因序列、核定位信号(NLS)、叶绿体信号肽、转录激活结构域(例如,VP64)、转录抑制结构域(例如KRAB结构与或SID结构域)、核酸酶结构域(例如Fok1),或其组合。
在本发明的第二方面,提供了一种融合蛋白组合,所述融合蛋白组合中包括第一融合蛋白和第二融合蛋白,所述第一融合蛋白和所述第二融合蛋白的结构如本发明第一方面所述的融合蛋白所示;其特征在于,所述第一融合蛋白和所述第二融合蛋白中的D2是不同的;
在另一优选例中,所述第一融合蛋白或第二融合蛋白从N端到C端具有式I所示的结构;
D1-(X)n-D2(式I)
式中,
D1为定位功能元件,其具有靶向和结合DNA的功能;
D2为去甲基化功能元件,其具有将甲基化核苷酸转化为非甲基化核苷酸的功能;
X为连接肽、表位标签或核定位信号(NLS);
n表示0-6的整数;
“-”表示连接上述元件的肽键;
其中,D1和D2的位置顺序可互换;
并且,所述第一融合蛋白和第二融合蛋白各自结构中的D2是不同的。
当n为0时,D1、D2直接通过肽键连接。
在另一优选例中,n为1。
在另一优选例中,X为核定位信号。
在另一优选例中,所述第一融合蛋白的D2为ROS1或其功能域;第二融合蛋白的D2为TET1或其功能域。
在本发明的第三方面,提供了一种核酸,编码如本发明第一方面所述的融合蛋白。
在另一优选例中,所述核酸的序列包括以下元件:
(1)Z1,为编码所述融合蛋白中的定位功能元件D1的核苷酸序列;和
(2)Z2,为编码所述融合蛋白中的去甲基化功能元件D2的核苷酸序列。
在另一优选例中,所述Z1元件包含选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:2所示的序列;
(ii)与SEQ ID NO:2所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:2所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的反向互补序列。
在另一优选例中,所述Z2元件包含选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:4所示的序列;
(ii)与SEQ ID NO:4所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:4所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的反向互补序列。
在另一优选例中,所述核酸包含编码核定位信号的序列,所述编码核定位信号的序列具有选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:6或SEQ ID NO:8任一项所示的序列;
(ii)与SEQ ID NO:6或SEQ ID NO:8任一项所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:6或SEQ ID NO:8任一项所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的反向互补序列。
在另一优选例中,所述核酸具有选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:10所示的序列;
(ii)与SEQ ID NO:10所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:10所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的反向互补序列。
在本发明的第四方面,提供了一种核酸构建物,包括第一核酸序列和一个或多个第二核酸序列,其中,所述第一核酸序列编码本发明第一方面所述的融合蛋白或本发明第二方面所述的融合蛋白组合,所述第二核酸序列为gRNA编码序列。
在另一优选例中,所述的第一核酸序列的5端和/或3端包括一个或多个核定位信号。
在另一优选例中,所述第一核酸序列的一端含有一个启动子,和任选地,另一端含有一个终止子;所述启动子选自RNA聚合酶II依赖型启动子,所述启动子选自UBI、UBQ、35S、Actin、SPL,CmYLCV、YAO、CDC45、rbcS、rbcL、PsGNS2、UEP1、TobRB7、Cab,或其组合。
在另一优选例中,所述核酸构建物含有1-6个gRNA编码序列。
在另一优选例中,所述的gRNA编码序列串联分布于第一核酸序列的5端或3端。
在另一优选例中,当含有两个或两个以上的第二核酸序列时,所述的第二核酸序列分布于第一核酸构序列的两端。
在另一优选例中,所述的第二核酸序列中每个gRNA编码序列的5端均含有一个RNA聚合酶III依赖型启动子启动子,所述启动子选自:U6、U3、U6a、U6b、U6c、U6-1、U3b、U3d、U6-26、U6-29、7SL或5H1。
在本发明的第五方面,提供了一种载体,含有本发明第三方面所述的核酸或本发明第四方面所述的核酸构建物。
在本发明的第六方面,提供了一种复合物,包含:
(1)蛋白组分,包含本发明第一方面所述融合蛋白或本发明第二方面所述的融合蛋白组合。
(2)核酸组分,为一个或多个gRNA序列;
其中,所述的蛋白组分与核酸组分相互结合形成所述复合物。
在本发明的第七方面,提供了一种多核苷酸组合,其编码本发明第二方面所述的融合蛋白组合。
在另一优选例中,所述多核苷酸组合中包括第一多核苷酸和第二多核苷酸,其中,所述第一多核苷酸和第二核苷酸均编码如本发明第一方面所述的融合蛋白,且两个融合蛋白的D2元件不同。
在另一优选例中,所述第一核苷酸和第二核苷酸分别还包括一个或多个gRNA编码序列。
在另一优选例中,所述第一多核苷酸和第二核苷酸位于同一载体或不同载体中。
在另一优选例中,所述第一多核苷酸和第二核苷酸位于不同载体中。
在另一优选例中,含有第一核酸的载体和含有第二核酸的载体同时或依次转化细胞。
在本发明的第八方面,提供了一种宿主细胞,所述宿主细胞中含有如本发明第一方面所述的融合蛋白、或本发明第二方面所述的融合蛋白组合、或本发明第五方面所述的载体、或本发明第六方面所述的复合物,或所述宿主细胞的基因组中整合有本发明第三方面所述的多核苷酸、或本发明第四方面所述的核酸构建物、或本发明第七方面所述的多核苷酸组合。
在另一优选例中,所述宿主细胞为真核细胞或原核细胞。
在另一优选例中,所述宿主细胞为植物细胞。
在另一优选例中,所述植物为单子叶植物或双子叶植物。
本发明第九方面,提供了一种制备本发明第一方面所述融合蛋白的方法,其包括以下步骤:
(1)在合适的条件下表达本发明第八方面所述的宿主细胞,
(2)分离提取所述的融合蛋白。
在另一优选例中,所述的宿主细胞中含有本发明第五方面所述的载体,或基因组中整合有本发明第三方面所述的多核苷酸。
在本发明的第十方面,提供了本发明第一方面所述的融合蛋白、或本发明第二方面所述的融合蛋白组合、或本发明第三方面所述的核酸、或本发明第四方面所述的核酸构建物、或本发明第五方面所述的载体、或本发明第六方面所述的复合物、或本发明第七方面所述的多核苷酸组合在对目标核酸进行去甲基化修饰中的用途。
在另一优选例中,所述的去甲基化为将甲基化胞嘧啶转变为非甲基化胞嘧啶。
在另一优选例中,所述目标核酸来自于真核生物或原核生物。
在另一优选例中,所述目标核酸来自植物细胞或动物细胞。
在另一优选例中,所述目标核酸来自于细胞核、细胞质、叶绿体或线粒体。
在另一优选例中,所述目标核酸为DNA、RNA或其组合。
在本发明的第十一方面,提供了本发明第一方面所述的融合蛋白、或本发明第二方面所述的融合蛋白组合、或本发明第三方面所述的核酸、或本发明第四方面所述的核酸构建物、或本发明第五方面所述的载体、或本发明第六方面所述的复合物、或本发明第七方面所述的多核苷酸组合在制备用于对目标核酸进行去甲基化修饰的试剂盒中的用途。
在本发明的第十二方面,提供了一种试剂盒,包含下组中的一种或多种:本发明第一方面所述的融合蛋白、或本发明第二方面所述的融合蛋白组合、或本发明第三方面所述的核酸、或本发明第四方面所述的核酸构建物、本发明第五方面所述的载体、本发明第六方面所述的复合物、本发明第七方面所述的多核苷酸组合,和本发明第八方面所述的宿主细胞。
在本发明的第十三方面,提供了一种减少细胞中靶基因或其启动子或其增强子的DNA甲基化的方法,所述的方法在细胞中表达本发明第一方面所述融合蛋白,和一个或多个与所述靶基因相关的gRNA。
本发明第十四方面,提供了一种调控靶基因表达的方法,其包括以下步骤:表达本发明第一方面所述的融合蛋白,并使其与靶基因或靶基因的表达调控元件结合,使该部位DNA发生去甲基化。
在另一优选例中,所述的调控包括:激活、增强、抑制、降低或使失活。
在另一优选例中,本发明提供了一种激活或增强基因表达的方法,其包括以下步骤:表达本发明第一方面所述的融合蛋白,并使其与靶基因的表达调控元件结合,使该部位DNA发生去甲基化。
在另一优选例中,所述的表达调控元件包括:启动子、增强子、终止子、转座子、沉默子。
在本发明的第十五方面,提供了一种调控植物性状的方法,其特征在于包括以下步骤:
(i)提供一种植物细胞;
(ii)将表达本发明第一方面所述融合蛋白和调控基因相关的gRNA的核酸序列导入所述的植物细胞,并整合到基因组中;
(iii)将所述的细胞培养成苗;
(iv)筛选具有目标性状的植株。
在另一优选例中,所述的导入细胞的方法包括农杆菌侵染、基因枪转化、显微注射法、电击法、超声波法和聚乙二醇(PEG)介导法。
在另一优选例中,所述的性状为植物表观遗传性状。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了实施例1中转基因T1植物中对靶向区域MEMS的甲基化水平的降低。
图2显示了实施例1中转基因T1植物中ROS1的表达水平。
图3显示了实施例1中转基因T2植物中MEMS位点去甲基化的遗传稳定性。
图4显示了实施例1中不同区域的去甲基化结果。
图5显示了实施例2中转基因T2植株的遗传稳定性。
图6显示了去甲基化基因编辑工具的结构组成。
具体实施方式
本发明人经过广泛而深入的研究,经过大量的筛选,首次开发了一种高效、定点去除DNA甲基化修饰的方法。具体地,本发明人将具有靶向和结合DNA功能的dCas9或其功能域与去甲基化酶ROS1或其功能域进行融合,从而获得一种融合蛋白;并且,引入多个对应于目标核酸序列的gRNA序列,从而进行精准定位,以对目标核酸区域进行去甲基化修饰。实验表明,本发明的去甲基化方法在植物中具有精准高效的去甲基化修饰效率,对研究植物的表观遗传学及通过去甲基化调控植物性状具有重要科学价值。在此基础上,完成了本发明。
术语
如本文所用,术语“融合蛋白”是指本发明第一方面所述的融合蛋白,其具有靶向结合DNA并且使目标甲基化核苷酸转化为非甲基化核苷酸的功能。
如本文所用,术语“融合蛋白组合”是指本发明中的多种融合蛋白的组合,在本发明的融合蛋白组合中,各融合蛋白具有不同的去甲基化酶催化结构域。优选地,所述的不同的去甲基化酶催化结构域对不同目标核酸位点的去甲基化效果不同,从而互相起到互补的作用。
如本文所用,术语“Cas蛋白”指一种核酸酶。一种优选的Cas蛋白是Cas9蛋白。典型的Cas9蛋白包括(但并不限于):来源于葡萄球菌(Staphylococcus aureus)的Cas9。在本发明中,所述的Cas9蛋白还可以被来源于其他CRISPR系统的Cas蛋白替换,如Cpf1核酸酶,所述Cpf1核酸酶的来源选自下组:酸性氨基球菌(Acidaminococcus)、毛螺菌科(Lachnospiraceae)、酸性氨基球菌突变体、毛螺菌科突变体。所述的“dCas9、dCpf1、dCas12、dCas13、dCms1、dMAD7”中的“d”代表“dead”,表示失去酶切割活性的Cas蛋白,即不能切割单链或双链DNA序列,但仍然能够与gRNA形成复合物,靶向并结合DNA序列。
如本文所用,术语“表位标签”通过分子遗传学手段,表位标签可以融合至目的蛋白的N端或C端,通过情况下不会影响目的蛋白的生物活性,而且易于用目的蛋白的检测。
如本文所使用,所述“连接肽”是将D1元件和D2元件相连形成融合蛋白、由多个氨基酸组成的短肽链,连接肽不影响融合蛋白功能的表达。所述连接肽的长度一般为1-100aa,较佳地,15-85aa,更佳地,25-70aa,更佳地,24-32aa。例如,常用的连接肽可以选用XTEN。
如本文所用,所述的“gRNA”又称为guide RNA或导向RNA,并且具有本领域技术人员通常理解的含义。一般而言,导向RNA可以包含同向(direct)重复序列和导向序列(guidesequence),或者基本上由或由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer))组成。gRNA在不同的CRISPR系统中,依据其所依赖的Cas蛋白的不同,可以包括crRNA和tracrRNA,也可以只含有crRNA。crRNA和tracrRNA可以经过人工改造融合形成single guide RNA(sgRNA)。本发明所述的gRNA可以是天然的,也可以是经过人工改造或设计合成的。在某些情况下,导向序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列,通常具有17-23nt的序列长度。在某些实施方案中,当最佳比对时,导向序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
如本文所用,所述的“功能域”是指的蛋白或酶中独立发挥其生物学功能、具有特异结构的区域。其可以是蛋白结构的一部分,也可以由一个或多个蛋白结构域以可操作连接的方式组成。结构域是由不同的二级结构和超二级结构组合而成,在蛋白功能表达中承担部分或全部生理功能的亚单位。常见结构域的氨基酸残基数在100~400个之间,最小的结构域只有40~50个氨基酸残基,大的结构域可超过400个氨基酸残基。
如本文所用,所述的“表观遗传”是指基因的DNA序列没有发生改变的情况下,基因功能发生了可遗传的变化,并最终导致了表型的变化。目前发现的影响表观遗传的机制有以下几种:DNA修饰(如DNA甲基化)、蛋白质共价修饰、副突变、非编码RNA的调控、染色质重塑或基因组印迹等。本所述的“表观遗传性状”是指植物中表观遗传机制控制或参与调控的、可以观察到的植物性状或特征。
去甲基化酶
本发明所述的去甲基化修饰主要指5-甲基胞嘧啶(5mC)的修饰,它是一种可逆的表观遗传修饰,在植物的生长发育过程中具有重要的作用。研究表明去甲基化修饰在植物生长发育中与印记基因表达、果实发育、生物和非生物胁迫、根瘤发育和根瘤固氮等过程具有重要的相关性。植物中常见的的去甲基化酶包括但不限于:ROS1、TET1、DME、DML等。
ROS1是一个具备双功能的糖苷酶,它可以直接切除甲基化胞嘧啶产生一个空碱基位点,接着引发碱基错配修复引入一个未经修饰的胞嘧啶。
TET是一种双加氧酶,它可以将甲基化的胞嘧啶氧化为5-羟甲基胞嘧啶,接着进一步催化为5-甲酰基胞嘧啶和5-羧基胞嘧啶,然后通过DNA糖基酶(TDG)切除掉5-甲酰基胞嘧啶或者5-羧基胞嘧啶产生一个空碱基位点,从而引发碱基错配修复重新引入一个未经修饰的胞嘧啶。
本发明融合蛋白及其编码序列
本发明提供了一种融合蛋白,其具有靶向结合DNA并且使目标甲基化核苷酸转化为非甲基化核苷酸的功能。
其中,所述D1元件无催化活性,并且选自下组:Cas蛋白、锌指蛋白或TALENs蛋白,或其功能结构域,或其组合。例如,所述D1元件选自下组:dCas9、dCpf1、dCas12、dCas13、dCms1、dMAD7,或其组合。优选地,所述D1元件为dCas9。
在一个优选的实施方式中,所述D1元件是dCas9蛋白的功能结构域,包含SEQ IDNO:1所示的氨基酸序列,或由其组成;其相应的编码核苷酸序列如SEQ ID NO:2所示。
优选地,所述D2元件具有将甲基化胞嘧啶转换为非甲基化胞嘧啶的功能。例如,所述D2元件是选自下组的去甲基化酶或其去甲基化功能域:ROS1、TET、DME、DML,或其组合;优选地,所述D2元件是ROS1或其功能域。
在一个优选的实施方式中,所述D2元件是ROS1蛋白的功能域,包含SEQ ID NO:3所示的氨基酸序列,或由其组成;其相应的编码核苷酸序列如SEQ ID NO:4所示。
在另一优选例中,所述的D1元件和D2元件通过一个或多个下列组件连接:肽键、连接肽、核定位信号、表位标签,或其组合。优选地,所述核定位信号,包含SEQ ID NO:5或SEQID NO:7所示的氨基酸序列,或由其组成;其各自相应的编码核苷酸序列如SEQ ID NO:6和SEQ ID NO:8所示。
在一个特别优选的实施方式中,所述融合蛋白,包含选自下列的序列,或由选自下列的序列组成:
(1)SEQ ID NO:9所示的氨基酸序列;
(2)与SEQ ID NO:9所示的序列相比具有一个或多个氨基酸的置换、缺失或添加(例如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个氨基酸的置换、缺失或添加)的序列;或
(3)与SEQ ID NO:9所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
在另一个优选的实施方式中,所述融合蛋白的N端或C端进一步包括以下一种或多种元件:表位标签、报告基因序列、核定位信号(NLS)、叶绿体信号肽、转录激活结构域(例如,VP64)、转录抑制结构域(例如KRAB结构与或SID结构域)、核酸酶结构域(例如Fok1),或其组合。
本发明还包括具有本发明融合蛋白的功能的片段和类似物。如本文所用,术语“片段”和“类似物”是指基本上保持本发明的融合蛋白相同的生物学功能或活性的多肽。
本发明的融合蛋白片段、衍生物或类似物可以是:(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的;或(ii)在一个或多个氨基酸残基中具有取代基团的多肽;或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽;或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或融合蛋白)。根据本文的定义这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明中,所述的所述融合蛋白变体是如SEQ ID NO:9所示的氨基酸序列,经过若干个(通常为1-60个,较佳地1-30个,更佳地1-20个,最佳地1-10个)取代、缺失或添加至少一个氨基酸所得的衍生序列,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在所述蛋白中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能,在C末端和/或\末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。这些保守性变异最好根据表1进行替换而产生。
表A
最初的残基 代表性的取代 优选的取代
Ala(A) Val;Leu;Ile Val
Arg(R) Lys;Gln;Asn Lys
Asn(N) Gln;His;Lys;Arg Gln
Asp(D) Glu Glu
Cys(C) Ser Ser
Gln(Q) Asn Asn
Glu(E) Asp Asp
Gly(G) Pro;Ala Ala
His(H) Asn;Gln;Lys;Arg Arg
Ile(I) Leu;Val;Met;Ala;Phe Leu
Leu(L) Ile;Val;Met;Ala;Phe Ile
Lys(K) Arg;Gln;Asn Arg
Met(M) Leu;Phe;Ile Leu
Phe(F) Leu;Val;Ile;Ala;Tyr Leu
Pro(P) Ala Ala
Ser(S) Thr Thr
Thr(T) Ser Ser
Trp(W) Tyr;Phe Tyr
Tyr(Y) Trp;Phe;Thr;Ser Phe
Val(V) Ile;Leu;Met;Phe;Ala Leu
本发明还包括所要求保护的融合蛋白的类似物。这些类似物与本发明序列SEQ IDNO:9的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些蛋白的类似物包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分了生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的蛋白并不限于上述例举的代表性的蛋白。
修饰(通常不改变一级结构)形式包括:体内或体外蛋白的化学衍生形式,所述的修饰能够保持或增强或部分抑制蛋白的转运功能;所述的修饰包括氨基酸侧链的化学修饰、肽链末端基团化学修饰,如巯基的化学修饰、氨基的化学修饰、羧基的化学修饰、二硫键的化学修饰及其他修饰;所述的化学修饰包括,磷酸化修饰(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)、糖基化修饰(由糖基化酶介导,如N-糖基化、O-糖基化)、脂酰化修饰(如乙酰化、棕榈酰化)等。
本发明还涉及产生融合蛋白或其片段、衍生物或类似物的方法。包括在(a)有助于所述融合蛋白或其片段、衍生物或类似物生产的条件下培养上述宿主细胞;和(b)分离所述融合蛋白或其片段、衍生物或类似物。
在本发明的生产方法中,用本领域众所周知的方法将所述细胞培养于适于所述融合蛋白产生的营养培养基上。若所述多肽被分泌入营养培养基中,则可直接从培养基中回收该多肽。若所述多肽不分泌到培养基中,则可从细胞裂解物中回收它。
可用本领域已知特异于所述多肽的方法检测该多肽。这些检测方法可包括使用特异抗体、形成酶产物或酶底物的消失。
产生的多肽可用本领域已知的方法回收。例如,可以通过离心收获细胞,用物理的或化学的方法使之破碎,并保留得到的粗提取液以进一步纯化。可以用任何方便的方法裂解表达本发明的融合蛋白或其片段、衍生物或类似物的转化宿主细胞,包括冻融循环、超声波、机械破碎或使用细胞溶解剂。这些方法是本领域技术人员熟知的。可以从转化宿主细胞的培养物中回收和纯化本发明的融合蛋白或其片段、衍生物或类似物,采用的方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲合层析、羟磷灰石层析和植物血凝素层析等等。
在一个特别优选的实施方式中,编码本发明融合蛋白的核酸能够编码SEQ ID NO:9所示的氨基酸序列,优选地具有SEQ ID NO:10所示的核苷酸序列。
本发明还包括与本发明的优选核酸序列(SEQ ID NO:10)具有至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同源性的核酸。
“同源性”或“同一性”是指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据,)那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目初一进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。通常,在将两个序列比对难以产生最大同一性时进行比较,这样的比对可以通过使用,例如计算机程序如Align程序(DNAstar,Inc.)(DNAstar,Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.J.Mol.Biol.J.Mol.Biol.J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.Appl Biosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此的方法来实现。此外,可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(J MoI Biol.48:444-453(1970))算法,使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。在本文中,所述基因的变体可以通过插入或删除调控区域,进行随机或定点突变等来获得。
在本发明中,SEQ ID NO:10中的核苷酸序列可以经过取代、缺失或添加一个或多个,生成SEQ ID NO:10的衍生序列,由于密码子的简并性,即使与SEQ ID NO:10的同源性较低,也能基本编码出如SEQ ID NO:9所示的氨基酸序列。另外,“在SEQ ID NO:10中的核苷酸序列经过取代、缺失或添加至少一个核苷酸衍生序列”的含义还包括能在中度严谨条件下,更佳的在高度严谨条件下与SEQ ID NO:10所示的核苷酸序列杂交的核苷酸序列。这些变异形式包括(但并小限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
本发明所述的多核苷酸或核酸序列可以是DNA形式或RNA形式。DNA形式包括:DNA、基因组DNA或人工合成的DNA,DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。
术语“编码本发明融合蛋白的多核苷酸”可以是包括编码此融合蛋白的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多苷或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酞胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。
本发明的核酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的DNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
本发明的主要优点包括:
1)本发明提供了一种高效、定点去除DNA甲基化修饰的融合蛋白及其编码序列,对研究DNA甲基化的功能具有重要意义。
2)本发明首次提供了去甲基化融合蛋白在植物中的应用,发现其在植物中具有精准高效的去甲基化修饰效率,对研究植物的表观遗传学及通过去甲基化调控植物性状具有重要科学价值。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
实施例1:去甲基化基因编辑工具载体的构建
1.1dCas9-TET1cd去甲基化工具
(1)利用实验室已有的dCas9和TET1序列,利用高保真酶Q5扩增得到dCas9和TET1cd的序列片段。胶回收片段以备用。
(2)利用Nco I和BamH I切开的p1300-UBQ-CAS9载体,通过切胶回收得到p1300-UBQ片段,备用。
(3)利用重组酶将dCas9片段重组进入p1300-UBQ片段得到p1300-UBQ-dCas9,备用。利用Sanger测序证明片段重组成功。
(4)接着利用BamHI切开上述得到的p1300-UBQ-dCas9载体。
(5)利用重组酶将TET1cd片段重组进入p1300-UBQ-dCas9片段得到p1300-UBQ-dCas9-TET1cd载体,此载体为靶向编辑DNA甲基化的终载体。利用Sanger测序证明片段重组成功。
1.2dCas9-ROS1cd去甲基化工具
(1)利用拟南芥的cDNA扩增得到ROS1cd的序列。
(2)利用重组酶将ROS1cd片段重组进入p1300-UBQ-dCas9片段得到p1300-UBQ-dCas9-ROS1cd载体,此载体为靶向编辑DNA甲基化的终载体。利用Sanger测序证明片段重组成功。
实施例2:ROS1启动子区MEMS去甲基化对ROS1表达的调控作用
2.1靶点设计与构建
(1)根据sgRNA设计的规则设计5个靶向MEMS区域的sgRNA,对应sgRNA的序列见表1。sgRNA除了由靶向MEMS区域的20bp以外,还存在一段用于连接反应的粘性末端。
表1靶向MEMS区域的sgRNA序列
Figure BDA0002392827420000181
Figure BDA0002392827420000191
(2)将sgRNA的F和R序列通过annealling program变成带有粘性末端的双链DNA片段。其过程为:将正反引物稀释到100μM,各取1μL与1μL T4 DNA连接酶缓冲液、0.5μL T4多核苷酸激酶、6.5μL ddH2O混合,将混合物在37℃30min,95℃5min,接着以0.2℃/s的速度降低到25℃,最后用水稀释250倍。
(3)用Bbs I酶切U6,U3b,7SL载体,回收载体片段,备用。
(4)取1μL双链sgRNA片段与1μL酶切的载体,利用T4连接酶将sgRNA连入U6,U3b,7SL载体中。sgMEMS-1和sgMEMS-4连入U6载体;sgMEMS-2和sgMEMS-5连入U3b载体;sgMEMS-3连入7SL载体。测序验证sgRNA成功连接进入相应载体。
(5)利用相应引物分别扩增上述得到的U6-sgMEMS-1,U3b-sgMEMS-2,7SL-sgMEMS-3载体,胶回收得到带有启动子和sgRNA的片段,备用。
(6)利用Sbf I+Xho I,Xho I+Xba I,Xba I+Xma I分别酶切上述得到的U6-sgMEMS-1,U3b-sgMEMS-2,7SL-sgMEMS-3片段,混合过柱纯化回收,备用。
(7)利用Sbf I+Xma I酶切p1300-UBQ-dCas9-TET1cd和p1300-UBQ-dCas9-ROS1cd载体,乙醇沉淀回收,备用。
(8)利用T4连接酶将上述得到的混合的3个sgRNA片段分别连接到p1300-UBQ-dCas9-TET1cd和p1300-UBQ-dCas9-ROS1cd载体上。16℃连接反应2h即可得到p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd载体。测序验证片段正确连入载体。
(9)下面将sgMEMS4和sgMEMS5连入p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd载体中,方法与上面类似。首先用对应引物PCR扩增得到U6-sgMEMS4和U3b-sgMEMS5片段;接着,用Kpn I+Xho I和Xho I+EcoR I分别酶切得到的U6-sgMEMS4和U3b-sgMEMS5片段,混合过柱纯化回收;然后,用Kpn I+EcoR I酶切p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd载体,乙醇纯化回收;用T4连接酶将混合的sgRNA片段连入p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd载体中,即得到最终载体p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd-sgMEMS4_5和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd-sgMEMS4_5载体中。
2.2遗传转化
(1)将p1300-sgMEMS1_2_3-UBQ-dCas9-TET1cd-sgMEMS4_5和p1300-sgMEMS1_2_3-UBQ-dCas9-ROS1cd-sgMEMS4_5载体直接转化农杆菌GV3101。
a.将质粒加入农杆菌感受态细胞中,之后冰浴5min,然后放入液氮中5min,接着37℃水浴锅5min。
b.取出离心管,加入适量无抗生素的LB培养液(500μL),28℃摇床震荡培养2h。
c.取少量菌液(50μL)涂抹于带有卡纳氨苄和利福平抗性的固体LB培养基上,在28℃培养箱中培养2d,即可看见菌落长出。
(2)将携带有载体的农杆菌转入拟南芥中。
a.挑取3个上述得到的单克隆菌落于含有3mL相应抗生素的LB培养液中,28℃摇床震荡培养16h。
b.去1mL上述菌液于含有100mL相应抗生素的LB培养液中,过夜培养,测定其OD值在1.5–2.0。
c.室温4000g 10min离心收集农杆菌菌体,将农杆菌重悬在新配置的100mL 5%蔗糖溶液中。
d.加入20μL Silwet L-77于上述蔗糖悬浮菌液中。
e.开花的拟南芥地上部分浸入上述溶液中,浸入15s左右。用保鲜膜包裹放于黑色托盘中,避光放入温室中,16-24h后,取出正常培养。
f.待果荚变黄,收取种子即为T1种子,备用。
2.3转基因阳性苗筛选
(1)将T1种子用5%次氯酸钠溶液消毒和灭菌,并用无菌水洗涤5遍后,备用。
(2)将种子重悬在适量的无菌水中,然后倒入含有潮霉素的1/2MS培养基上,让种子均匀分布于培养基上,待吹干后,将板子用锡箔纸包裹起来,放于4℃冰箱7d。
(3)将板子放入恒温培养箱中10-14d。将阳性苗移植到土里,放入温室中培养。
2.4DNA甲基化水平及编辑效率的检测
(1)待阳性苗长到合适大小时,取阳性苗叶片提取DNA。DNA提取用QIAGEN的植物DNA提取试剂盒。
(2)测定阳性苗甲基化水平
a.用重亚硫酸盐处理阳性苗的DNA。此步骤用名字为BisulFlash DNAModification的试剂盒完成。
b.用特意设计、专门用于甲基化测序的引物扩增上述处理后的DNA,胶回收DNA,备用。
c.将每个阳性苗对应的胶回收产物混合,接着送入测序平台,进行测序。
d.分析甲基化数据并统计甲基化编辑效率。我们定义:对照DNA甲基化/阳性苗甲基化>1.5为编辑成功的阳性苗。
2.5DNA去甲基化的遗传的稳定性
(1)选取一株编辑成功的阳性苗,收获种子为T2。
(2)将收获的T2种子消毒和灭菌,种植于正常的1/2MS培养基上,4℃放置7d,恒温培养箱中14d,移植到土里于温室培养。
(3)选取若干植株,取其叶片,用CTAB法提取其DNA,利用M13F和sgRNA分析鉴定存在载体和不存在载体的植株。
(4)存在载体的植株和不存在载体的植株各选取一株,再次取其叶片,用QIAGEN的植物DNA提取试剂盒提取DNA。
(5)分析其DNA甲基化的水平。
2.6基因表达分析
(1)对于选中的植株,取其叶片,用QIAGEN的植物RNA提取试剂盒提取RNA。
(2)用全式金的反转录试剂盒将RNA反转成cDNA。
(3)用Takara公司的SYBR分析基因的表达水平。
2.7实验结果
(1)dCas9-ROS1cd和dCas9-TET1cd在转基因T1植物中降低靶向区域MEMS的甲基化水平
如图1所示,dCas9-ROS1cd的13号和14号转基因植株、dCas9-TETcd1的5号和14号转基因植株相比于野生型以、dCas9的阳性对照植株均发生了显著的去甲基化修饰。
(2)ROS1的表达水平
如图2所示,dCas9-ROScd1的13号和14号转基因植株、dCas9-TET1cd的5号和14号转基因植株中ROS1的表达量均低于野生型和对照组。
(3)dCas9-ROS1cd和dCas9-TET1cd在MEMS位点的编辑效率表2
工具 T1中转基因植株数 去甲基化数目 去甲基化百分比
dCas9-ROS1cd 15 5 33%
dCas9-TET1cd 15 2 13%
(4)MEMS位点去甲基化的遗传稳定性
如图3所示,T2代植株中,具有dCas9-TET1cd的转基因株系在MEMS位点保持了原有的低甲基化水平,无转基因的dCas9-TET1cd T2个体表现出甲基化逆转。
2.8实验结论
dCas9-ROS1cd和dCas9-TET1cd均可以介导植物中ROS1启动子区MEMS位点的去甲基化,且dCas9-ROS1cd去甲基化编辑效率高于dCas9-TET1cd。MEMS位点的去甲基化可有效降低ROS1基因的表达。表明DNA的甲基化和去甲基化可有效调控基因的表达。
实施例3:RdDM突变体(nrpd1)中去甲基化实验
3.1靶点设计
靶点设计与前面一致,1、2、3号sgRNA连入融合蛋白的上游,而4、5、6号sgRNA连入融合蛋白的下游,sgRNA的序列见表3,此sgRNA序列组成与前面的sgRNA是一致的。
表3靶向多个区域的sgRNA序列
Figure BDA0002392827420000231
Figure BDA0002392827420000241
3.2遗传转化
参见实验例中步骤2遗传转化过程。
3.3阳性苗筛选
参见实验例中步骤3阳性苗筛选。
3.4DNA甲基化水平及编辑效率的检测
(1)待阳性苗长到合适大小时,取阳性苗叶片用CTAB法提取DNA。
(2)利用Chop-PCR分析阳性苗甲基化水平。
a.用适当的甲基化敏感的限制性内切酶处理1ug DNA,处理时间为12h-16h。
b.利用相应的引物扩增酶切处理后的DNA,电泳,以条带明暗判断甲基化的高低。
(3)将Chop-PCR判断甲基化降低的阳性苗标记上,再次取叶片,用GIAGEN的试剂盒提取DNA。
(4)甲基化测序分析DNA甲基化水平
a.用重亚硫酸盐处理试剂盒提取的DNA。
b.用设计的引物扩征处理后DNA,电泳,胶回收,备用。
c.利用T4连接酶将上述回收片段连入Takara公司的p20T载体。
d.挑取阳性克隆,菌落PCR,测序。
e.用KISMETH分析甲基化水平。
f.利用Chop-PCR统计甲基化编辑效率。
3.5DNA去甲基化的遗传的稳定性
与前面一致,只是测定甲基化用酶连测序分析。
3.6实验结果
(1)dCas9-ROS1cd和dCas9-TET1cd对不同区域的去甲基化结果
图注:a,b,c分别对应3个位点的甲基化编辑结果;每个图的最下面表示编辑区域在染色体上的位置,红色线代表CG位点在基因组上的位置,蓝色线代表CHG位点在基因组上的位置,黑色箭头代表用于分析DNA甲基化引物的位置,sgRNA对应基因组的位置也被标记显示在图中;每个图的上方代表DNA甲基化的水平,实心代表对应位点有DNA甲基化,空心代表没有DNA甲基化,红色代表CG甲基化,蓝色代表CHG甲基化,绿色代表CHH甲基化。
如图4所示,在Chr4.8670151-8671193位点,dCas9-ROS1cd的L44转基因植株、dCas9-TETcd1的L4转基因植株均发生了显著的去甲基化修饰,其DNA甲基化几乎全部被靶向移除。在Chr5.9872445-9873033(solo-LTR site)位点,只有dCas9-ROS1cd的J41转基因植株发生了显著的去甲基化修饰。相反,在Chr3:2849440-2849791位点,只有dCas9-TET1cd的E6发生了显著的去甲基化修饰。
(2)dCas9-ROS1cd和dCas9-TET1cd在不同区域的编辑效率表4
Figure BDA0002392827420000251
Figure BDA0002392827420000261
(3)遗传稳定性
如图5所示,T2代植株中,具有转基因株系和无转基因的T2个体均保持其低甲基化的状态。
3.7实验结论
dCas9-ROS1cd和dCas9-TET1cd均可以介导Chr4.8670151-8671193位点的DNA发生去甲基化,且dCas9-TET1cd去甲基化编辑效率高于dCas9-ROS1cd。然而,对于Chr5.9872445-9873033(solo-LTR site)位点,只有dCas9-ROS1cd成功使其发生去甲基化修饰。相反,对于Chr3:2849440-2849791位点,只有dCas9-TET1cd成功使其发生去甲基化修饰。对于不同的位点,dCas9-ROS1cd和dCas9-TET1cd表现出不同的效率,它们可以在应用时,进行互补。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 山东舜丰生物科技有限公司
<120> 一种融合蛋白及其应用
<130> P2019-1758
<160> 56
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1367
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1010 1015 1020
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1025 1030 1035 1040
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1045 1050 1055
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1060 1065 1070
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1075 1080 1085
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1090 1095 1100
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1105 1110 1115 1120
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1125 1130 1135
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1140 1145 1150
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1155 1160 1165
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1170 1175 1180
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1185 1190 1195 1200
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1205 1210 1215
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1250 1255 1260
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1265 1270 1275 1280
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1285 1290 1295
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1300 1305 1310
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1315 1320 1325
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1330 1335 1340
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1345 1350 1355 1360
Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 4101
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gacaagaagt acagcatcgg cctggcaatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggacgccatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga c 4101
<210> 3
<211> 558
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Ser Cys Gln Lys Pro Thr Leu Lys Glu Lys Gly Lys Lys Val Leu Lys
1 5 10 15
Glu Glu Lys Lys Ala Phe Asp Trp Asp Cys Leu Arg Arg Glu Ala Gln
20 25 30
Ala Arg Ala Gly Ile Arg Glu Lys Thr Arg Ser Thr Met Asp Thr Val
35 40 45
Asp Trp Lys Ala Ile Arg Ala Ala Asp Val Lys Glu Val Ala Glu Thr
50 55 60
Ile Lys Ser Arg Gly Met Asn His Lys Leu Ala Glu Arg Ile Gln Gly
65 70 75 80
Phe Leu Asp Arg Leu Val Asn Asp His Gly Ser Ile Asp Leu Glu Trp
85 90 95
Leu Arg Asp Val Pro Pro Asp Lys Ala Lys Glu Tyr Leu Leu Ser Phe
100 105 110
Asn Gly Leu Gly Leu Lys Ser Val Glu Cys Val Arg Leu Leu Thr Leu
115 120 125
His His Leu Ala Phe Pro Val Asp Thr Asn Val Gly Arg Ile Ala Val
130 135 140
Arg Leu Gly Trp Val Pro Leu Gln Pro Leu Pro Glu Ser Leu Gln Leu
145 150 155 160
His Leu Leu Glu Met Tyr Pro Met Leu Glu Ser Ile Gln Lys Tyr Leu
165 170 175
Trp Pro Arg Leu Cys Lys Leu Asp Gln Lys Thr Leu Tyr Glu Leu His
180 185 190
Tyr Gln Met Ile Thr Phe Gly Lys Val Phe Cys Thr Lys Ser Lys Pro
195 200 205
Asn Cys Asn Ala Cys Pro Met Lys Gly Glu Cys Arg His Phe Ala Ser
210 215 220
Ala Phe Ala Ser Ala Arg Leu Ala Leu Pro Ser Thr Glu Lys Gly Met
225 230 235 240
Gly Thr Pro Asp Lys Asn Pro Leu Pro Leu His Leu Pro Glu Pro Phe
245 250 255
Gln Arg Glu Gln Gly Ser Glu Val Val Gln His Ser Glu Pro Ala Lys
260 265 270
Lys Val Thr Cys Cys Glu Pro Ile Ile Glu Glu Pro Ala Ser Pro Glu
275 280 285
Pro Glu Thr Ala Glu Val Ser Ile Ala Asp Ile Glu Glu Ala Phe Phe
290 295 300
Glu Asp Pro Glu Glu Ile Pro Thr Ile Arg Leu Asn Met Asp Ala Phe
305 310 315 320
Thr Ser Asn Leu Lys Lys Ile Met Glu His Asn Lys Glu Leu Gln Asp
325 330 335
Gly Asn Met Ser Ser Ala Leu Val Ala Leu Thr Ala Glu Thr Ala Ser
340 345 350
Leu Pro Met Pro Lys Leu Lys Asn Ile Ser Gln Leu Arg Thr Glu His
355 360 365
Arg Val Tyr Glu Leu Pro Asp Glu His Pro Leu Leu Ala Gln Leu Glu
370 375 380
Lys Arg Glu Pro Asp Asp Pro Cys Ser Tyr Leu Leu Ala Ile Trp Thr
385 390 395 400
Pro Gly Glu Thr Ala Asp Ser Ile Gln Pro Ser Val Ser Thr Cys Ile
405 410 415
Phe Gln Ala Asn Gly Met Leu Cys Asp Glu Glu Thr Cys Phe Ser Cys
420 425 430
Asn Ser Ile Lys Glu Thr Arg Ser Gln Ile Val Arg Gly Thr Ile Leu
435 440 445
Ile Pro Cys Arg Thr Ala Met Arg Gly Ser Phe Pro Leu Asn Gly Thr
450 455 460
Tyr Phe Gln Val Asn Glu Val Phe Ala Asp His Ala Ser Ser Leu Asn
465 470 475 480
Pro Ile Asn Val Pro Arg Glu Leu Ile Trp Glu Leu Pro Arg Arg Thr
485 490 495
Val Tyr Phe Gly Thr Ser Val Pro Thr Ile Phe Lys Gly Leu Ser Thr
500 505 510
Glu Lys Ile Gln Ala Cys Phe Trp Lys Gly Tyr Val Cys Val Arg Gly
515 520 525
Phe Asp Arg Lys Thr Arg Gly Pro Lys Pro Leu Ile Ala Arg Leu His
530 535 540
Phe Pro Ala Ser Lys Leu Lys Gly Gln Gln Ala Asn Leu Ala
545 550 555
<210> 4
<211> 1677
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
agttgtcaga aacctacctt aaaagaaaaa gggaaaaagg ttttgaagga ggaaaaaaaa 60
gcgtttgact gggattgttt aagaagagaa gcccaagcta gagcaggaat tagagaaaaa 120
acaagaagta caatggacac cgtggattgg aaggcaatac gagcagcaga tgttaaggaa 180
gttgctgaaa caatcaagag tcgcgggatg aaccataaac ttgcagaacg tatacagggc 240
ttccttgatc gactggtaaa tgaccatgga agtatcgatc ttgaatggtt gagagatgtt 300
ccaccagata aagcaaaaga atatcttctg agctttaacg gattgggact gaaaagtgtg 360
gagtgtgtgc ggcttctaac acttcaccat cttgcctttc cagttgatac aaatgttggg 420
cgcatagccg tcagacttgg atgggtgccc cttcagccgc tcccagagtc acttcagttg 480
catcttctgg aaatgtatcc tatgcttgaa tctattcaaa agtatctttg gccccgtctc 540
tgcaaactcg accaaaaaac attgtatgag ttgcactacc agatgattac ttttggaaag 600
gtcttttgca caaagagcaa acctaattgc aatgcatgtc cgatgaaagg agaatgcaga 660
cattttgcca gtgcgtttgc aagtgcaagg cttgctttac caagtacaga gaaaggtatg 720
gggacacctg ataaaaaccc tttgcctcta cacctgccag agccattcca gagagagcaa 780
gggtctgaag tagtacagca ctcagaacca gcaaaaaagg tcacatgttg tgaaccaatc 840
atcgaagagc ctgcttcacc ggagccagaa accgcagaag tatcaatagc tgacatagag 900
gaggcgtttt ttgaggatcc agaagaaatt cctaccatca ggctaaacat ggatgcattt 960
accagtaact tgaagaagat aatggaacac aacaaggaac ttcaagacgg aaacatgtcc 1020
agcgctttag ttgcacttac tgctgaaact gcttctcttc caatgcctaa gctcaagaat 1080
atcagccagt taaggacaga acaccgagtt tacgaacttc cagacgagca tcctcttcta 1140
gctcagttgg aaaagagaga acctgatgat ccatgttctt atttgcttgc tatatggacg 1200
ccaggtgaga cggctgattc tattcaaccg tctgttagta cgtgcatatt ccaagcaaat 1260
ggtatgcttt gtgacgagga gacttgtttc tcctgcaaca gcatcaagga gactagatct 1320
caaattgtga gagggacaat tttgattcct tgtagaacag cgatgagggg tagttttcct 1380
ctaaatggaa cgtactttca agtaaatgag gtgtttgcgg atcatgcatc cagcctaaac 1440
ccaatcaatg tcccaaggga attgatatgg gaattacctc gaagaacggt ctattttggt 1500
acctctgttc ctacgatatt caaaggttta tcaactgaga agatacaggc ttgcttttgg 1560
aaagggtacg tatgtgtacg tggatttgat cgaaagacga ggggaccgaa gcctttgatt 1620
gcaagattgc acttcccggc gagcaaactg aagggacaac aagctaacct cgcctaa 1677
<210> 5
<211> 40
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala
35 40
<210> 6
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
<210> 7
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 8
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 48
<210> 9
<211> 1986
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1010 1015 1020
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1025 1030 1035 1040
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1045 1050 1055
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1060 1065 1070
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1075 1080 1085
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1090 1095 1100
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1105 1110 1115 1120
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1125 1130 1135
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1140 1145 1150
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1155 1160 1165
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1170 1175 1180
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1185 1190 1195 1200
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1205 1210 1215
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1220 1225 1230
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1250 1255 1260
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1265 1270 1275 1280
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1285 1290 1295
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1300 1305 1310
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1315 1320 1325
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1330 1335 1340
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1345 1350 1355 1360
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1365 1370 1375
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1380 1385 1390
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys
1395 1400 1405
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1410 1415 1420
Gly Gly Gly Ser Ser Cys Gln Lys Pro Thr Leu Lys Glu Lys Gly Lys
1425 1430 1435 1440
Lys Val Leu Lys Glu Glu Lys Lys Ala Phe Asp Trp Asp Cys Leu Arg
1445 1450 1455
Arg Glu Ala Gln Ala Arg Ala Gly Ile Arg Glu Lys Thr Arg Ser Thr
1460 1465 1470
Met Asp Thr Val Asp Trp Lys Ala Ile Arg Ala Ala Asp Val Lys Glu
1475 1480 1485
Val Ala Glu Thr Ile Lys Ser Arg Gly Met Asn His Lys Leu Ala Glu
1490 1495 1500
Arg Ile Gln Gly Phe Leu Asp Arg Leu Val Asn Asp His Gly Ser Ile
1505 1510 1515 1520
Asp Leu Glu Trp Leu Arg Asp Val Pro Pro Asp Lys Ala Lys Glu Tyr
1525 1530 1535
Leu Leu Ser Phe Asn Gly Leu Gly Leu Lys Ser Val Glu Cys Val Arg
1540 1545 1550
Leu Leu Thr Leu His His Leu Ala Phe Pro Val Asp Thr Asn Val Gly
1555 1560 1565
Arg Ile Ala Val Arg Leu Gly Trp Val Pro Leu Gln Pro Leu Pro Glu
1570 1575 1580
Ser Leu Gln Leu His Leu Leu Glu Met Tyr Pro Met Leu Glu Ser Ile
1585 1590 1595 1600
Gln Lys Tyr Leu Trp Pro Arg Leu Cys Lys Leu Asp Gln Lys Thr Leu
1605 1610 1615
Tyr Glu Leu His Tyr Gln Met Ile Thr Phe Gly Lys Val Phe Cys Thr
1620 1625 1630
Lys Ser Lys Pro Asn Cys Asn Ala Cys Pro Met Lys Gly Glu Cys Arg
1635 1640 1645
His Phe Ala Ser Ala Phe Ala Ser Ala Arg Leu Ala Leu Pro Ser Thr
1650 1655 1660
Glu Lys Gly Met Gly Thr Pro Asp Lys Asn Pro Leu Pro Leu His Leu
1665 1670 1675 1680
Pro Glu Pro Phe Gln Arg Glu Gln Gly Ser Glu Val Val Gln His Ser
1685 1690 1695
Glu Pro Ala Lys Lys Val Thr Cys Cys Glu Pro Ile Ile Glu Glu Pro
1700 1705 1710
Ala Ser Pro Glu Pro Glu Thr Ala Glu Val Ser Ile Ala Asp Ile Glu
1715 1720 1725
Glu Ala Phe Phe Glu Asp Pro Glu Glu Ile Pro Thr Ile Arg Leu Asn
1730 1735 1740
Met Asp Ala Phe Thr Ser Asn Leu Lys Lys Ile Met Glu His Asn Lys
1745 1750 1755 1760
Glu Leu Gln Asp Gly Asn Met Ser Ser Ala Leu Val Ala Leu Thr Ala
1765 1770 1775
Glu Thr Ala Ser Leu Pro Met Pro Lys Leu Lys Asn Ile Ser Gln Leu
1780 1785 1790
Arg Thr Glu His Arg Val Tyr Glu Leu Pro Asp Glu His Pro Leu Leu
1795 1800 1805
Ala Gln Leu Glu Lys Arg Glu Pro Asp Asp Pro Cys Ser Tyr Leu Leu
1810 1815 1820
Ala Ile Trp Thr Pro Gly Glu Thr Ala Asp Ser Ile Gln Pro Ser Val
1825 1830 1835 1840
Ser Thr Cys Ile Phe Gln Ala Asn Gly Met Leu Cys Asp Glu Glu Thr
1845 1850 1855
Cys Phe Ser Cys Asn Ser Ile Lys Glu Thr Arg Ser Gln Ile Val Arg
1860 1865 1870
Gly Thr Ile Leu Ile Pro Cys Arg Thr Ala Met Arg Gly Ser Phe Pro
1875 1880 1885
Leu Asn Gly Thr Tyr Phe Gln Val Asn Glu Val Phe Ala Asp His Ala
1890 1895 1900
Ser Ser Leu Asn Pro Ile Asn Val Pro Arg Glu Leu Ile Trp Glu Leu
1905 1910 1915 1920
Pro Arg Arg Thr Val Tyr Phe Gly Thr Ser Val Pro Thr Ile Phe Lys
1925 1930 1935
Gly Leu Ser Thr Glu Lys Ile Gln Ala Cys Phe Trp Lys Gly Tyr Val
1940 1945 1950
Cys Val Arg Gly Phe Asp Arg Lys Thr Arg Gly Pro Lys Pro Leu Ile
1955 1960 1965
Ala Arg Leu His Phe Pro Ala Ser Lys Leu Lys Gly Gln Gln Ala Asn
1970 1975 1980
Leu Ala
1985
<210> 10
<211> 5961
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggcaatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggacgccatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagg gtggaggagg atccagttgt cagaaaccta ccttaaaaga aaaagggaaa 4320
aaggttttga aggaggaaaa aaaagcgttt gactgggatt gtttaagaag agaagcccaa 4380
gctagagcag gaattagaga aaaaacaaga agtacaatgg acaccgtgga ttggaaggca 4440
atacgagcag cagatgttaa ggaagttgct gaaacaatca agagtcgcgg gatgaaccat 4500
aaacttgcag aacgtataca gggcttcctt gatcgactgg taaatgacca tggaagtatc 4560
gatcttgaat ggttgagaga tgttccacca gataaagcaa aagaatatct tctgagcttt 4620
aacggattgg gactgaaaag tgtggagtgt gtgcggcttc taacacttca ccatcttgcc 4680
tttccagttg atacaaatgt tgggcgcata gccgtcagac ttggatgggt gccccttcag 4740
ccgctcccag agtcacttca gttgcatctt ctggaaatgt atcctatgct tgaatctatt 4800
caaaagtatc tttggccccg tctctgcaaa ctcgaccaaa aaacattgta tgagttgcac 4860
taccagatga ttacttttgg aaaggtcttt tgcacaaaga gcaaacctaa ttgcaatgca 4920
tgtccgatga aaggagaatg cagacatttt gccagtgcgt ttgcaagtgc aaggcttgct 4980
ttaccaagta cagagaaagg tatggggaca cctgataaaa accctttgcc tctacacctg 5040
ccagagccat tccagagaga gcaagggtct gaagtagtac agcactcaga accagcaaaa 5100
aaggtcacat gttgtgaacc aatcatcgaa gagcctgctt caccggagcc agaaaccgca 5160
gaagtatcaa tagctgacat agaggaggcg ttttttgagg atccagaaga aattcctacc 5220
atcaggctaa acatggatgc atttaccagt aacttgaaga agataatgga acacaacaag 5280
gaacttcaag acggaaacat gtccagcgct ttagttgcac ttactgctga aactgcttct 5340
cttccaatgc ctaagctcaa gaatatcagc cagttaagga cagaacaccg agtttacgaa 5400
cttccagacg agcatcctct tctagctcag ttggaaaaga gagaacctga tgatccatgt 5460
tcttatttgc ttgctatatg gacgccaggt gagacggctg attctattca accgtctgtt 5520
agtacgtgca tattccaagc aaatggtatg ctttgtgacg aggagacttg tttctcctgc 5580
aacagcatca aggagactag atctcaaatt gtgagaggga caattttgat tccttgtaga 5640
acagcgatga ggggtagttt tcctctaaat ggaacgtact ttcaagtaaa tgaggtgttt 5700
gcggatcatg catccagcct aaacccaatc aatgtcccaa gggaattgat atgggaatta 5760
cctcgaagaa cggtctattt tggtacctct gttcctacga tattcaaagg tttatcaact 5820
gagaagatac aggcttgctt ttggaaaggg tacgtatgtg tacgtggatt tgatcgaaag 5880
acgaggggac cgaagccttt gattgcaaga ttgcacttcc cggcgagcaa actgaaggga 5940
caacaagcta acctcgccta a 5961
<210> 11
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gattgtggcc taacgtataa agaag 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaaccttctt tatacgttag gccac 25
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ggtcgtcata accgtttgtt tatgt 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaacacataa acaaacggtt atgac 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ttacgaatca tctttcccat agtct 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aaacagacta tgggaaagat gattc 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gattgatgta gggcgaaagt tcgtt 25
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aaacaacgaa ctttcgccct acatc 25
<210> 19
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ggtcgggttg gcgggaaaag tttta 25
<210> 20
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaactaaaac ttttcccgcc aaccc 25
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ttcaattccg gctgaaacac 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gtgtttcagc cggaattgaa 20
<210> 23
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
aagaggatat cttgctctc 19
<210> 24
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gagagcaaga tatcctctt 19
<210> 25
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ttgctctctc tgaaagatg 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
catctttcag agagagcaa 19
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
actgacacgt gttttctatg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
catagaaaac acgtgtcagt 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gcttccttag aagcgttggt 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
accaacgctt ctaaggaagc 20
<210> 31
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
ccgttggatt aggttcgtg 19
<210> 32
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
cacgaaccta atccaacgg 19
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gattagagaa cgtagaataa 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ttattctacg ttctctaatc 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
taatgacatc catacttatc 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gataagtatg gatgtcatta 20
<210> 37
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
catctctatc cataagata 19
<210> 38
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tatcttatgg atagagatg 19
<210> 39
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gtttcacatc cttcggctt 19
<210> 40
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
aagccgaagg atgtgaaac 19
<210> 41
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
tagtagagct tacttagct 19
<210> 42
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
agctaagtaa gctctacta 19
<210> 43
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
aatcttttat gacaatcaga 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tctgattgtc ataaaagatt 20
<210> 45
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
aaatgagggt agtggttga 19
<210> 46
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tcaaccacta ccctcattt 19
<210> 47
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ataaatctaa agttgtcgc 19
<210> 48
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gcgacaactt tagatttat 19
<210> 49
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
aaacacagca cgctactca 19
<210> 50
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tgagtagcgt gctgtgttt 19
<210> 51
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
taacttgagt cgcgacgatt 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
aatcgtcgcg actcaagtta 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctgaaaaaat cagcgttcac 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gtgaacgctg attttttcag 20
<210> 55
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
acagcgacca gaaaaatag 19
<210> 56
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ctatttttct ggtcgctgt 19

Claims (12)

1.一种融合蛋白,其特征在于,包括选自下列的组分:
(1)定位功能元件D1,其具有靶向和结合DNA的功能;和
(2)去甲基化功能元件D2,其具有将甲基化核苷酸转化为非甲基化核苷酸的功能。
2.如权利要求1所述的融合蛋白,其特征在于,所述D1无催化活性,并且选自下组:Cas蛋白、锌指蛋白或TALENs蛋白,或其功能域,或其组合;
优选的,所述D1选自下组:dCas9、dCpf1、dCas12、dCas13、dCms1、dMAD7,或其功能域,或其组合。
3.如权利要求1或2所述的融合蛋白,其特征在于,所述D2具有将甲基化胞嘧啶转换为非甲基化胞嘧啶的功能;
优选的,所述D2是选自下组的去甲基化酶或其去甲基化功能域:ROS1、TET、DME、DML,或其组合。
4.如权利要求1所述的融合蛋白,其特征在于,所述D1和D2通过一个或多个下列组件连接:肽键、连接肽、核定位信号、表位标签,或其组合。
5.一种融合蛋白组合,其特征在于,所述融合蛋白组合包括第一融合蛋白和第二融合蛋白;
所述第一融合蛋白和所述第二融合蛋白的结构各自独立地如权利要求1-4任一项所述的融合蛋白所示;
并且所述第一融合蛋白和所述第二融合蛋白中的D2是不同的;
优选的,所述第一融合蛋白的D2选自ROS1或其功能域,所述第二融合蛋白的D2选自TET或其功能域。
6.一种核酸,其特征在于,编码如权利要求1-4任一项所述的融合蛋白或权利要求5所述的融合蛋白组合。
7.一种核酸构建物,其特征在于,包括第一核酸序列和一个或多个第二核酸序列,其中,所述第一核酸序列编码如权利要求1-4任一项所述的融合蛋白或权利要求5所述的融合蛋白组合,所述第二核酸序列为gRNA编码序列。
8.一种载体,其特征在于,含有权利要求6所述的核酸或权利要求7所述的核酸构建物。
9.一种复合物,其特征在于,包含:
(1)蛋白组分,包含权利要求1-4任一项所述的融合蛋白或权利要求5所述的融合蛋白组合。
(2)核酸组分,为一个或多个gRNA序列;
其中,所述的蛋白组分与核酸组分相互结合形成所述复合物。
10.一种宿主细胞,其特征在于,所述宿主细胞中含有如权利要求1-4任一项所述的融合蛋白、或权利要求5所述的融合蛋白组合、或权利要求8所述的载体、或权利要求9所述的复合物,或所述宿主细胞的基因组中整合有权利要求6所述的核酸或权利要求7所述的核酸构建物。
11.权利要求1-4任一项所述的融合蛋白、或权利要求5所述的融合蛋白组合、或权利要求6所述的核酸、或权利要求7所述的核酸构建物、或权利要求8所述的载体、或权利要求9所述的复合物在对目标核酸进行去甲基化修饰中的用途。
12.权利要求1-4任一项所述的融合蛋白、或权利要求5所述的融合蛋白组合、或权利要求6所述的核酸、或权利要求7所述的核酸构建物、或权利要求8所述的载体、或权利要求9所述的复合物在制备用于对目标核酸进行去甲基化修饰的试剂盒中的用途。
CN202010120522.0A 2020-02-26 2020-02-26 一种融合蛋白及其应用 Pending CN113307878A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010120522.0A CN113307878A (zh) 2020-02-26 2020-02-26 一种融合蛋白及其应用
PCT/CN2021/077328 WO2021169925A1 (zh) 2020-02-26 2021-02-23 一种融合蛋白及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010120522.0A CN113307878A (zh) 2020-02-26 2020-02-26 一种融合蛋白及其应用

Publications (1)

Publication Number Publication Date
CN113307878A true CN113307878A (zh) 2021-08-27

Family

ID=77370001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010120522.0A Pending CN113307878A (zh) 2020-02-26 2020-02-26 一种融合蛋白及其应用

Country Status (2)

Country Link
CN (1) CN113307878A (zh)
WO (1) WO2021169925A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151293A (zh) * 2020-10-20 2021-07-23 中国农业科学院生物技术研究所 抗逆基因线路AcDwEm及其提高作物耐盐抗旱耐高温的应用
CN114195902A (zh) * 2021-10-18 2022-03-18 翌圣生物科技(上海)股份有限公司 重组蛋白结构域增强tet酶及全基因组dna甲基化检测方法
CN114540325A (zh) * 2022-01-17 2022-05-27 广州医科大学 靶向dna去甲基化的方法、融合蛋白及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016022363A2 (en) * 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
WO2017208247A1 (en) * 2016-06-02 2017-12-07 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
EP3574102A4 (en) * 2017-01-26 2020-09-30 The Regents of The University of California TARGETED GENE METHYLATION IN PLANTS
EP3655533A1 (en) * 2017-02-24 2020-05-27 Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts, Universitätsmedizin Method for re-expression of different hypermethylated genes involved in fibrosis, like hypermethylated rasal,1 and use thereof in treatment of fibrosis as well as kit of parts for re-expression of hypermethylated genes including rasal1 in a subject
KR102617424B1 (ko) * 2018-04-03 2023-12-26 서울대학교산학협력단 동물 세포에서 표적 dna의 메틸화 감소와 표적 유전자의 발현 증가를 위한 조성물, 키트, 및 이를 이용한 방법
US20210299174A1 (en) * 2018-05-30 2021-09-30 M2X2 Therapeutics, Inc. Cell therapy

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113151293A (zh) * 2020-10-20 2021-07-23 中国农业科学院生物技术研究所 抗逆基因线路AcDwEm及其提高作物耐盐抗旱耐高温的应用
CN113151293B (zh) * 2020-10-20 2023-03-10 中国农业科学院生物技术研究所 抗逆基因线路AcDwEm及其提高作物耐盐抗旱耐高温的应用
CN114195902A (zh) * 2021-10-18 2022-03-18 翌圣生物科技(上海)股份有限公司 重组蛋白结构域增强tet酶及全基因组dna甲基化检测方法
CN114591441A (zh) * 2021-10-18 2022-06-07 翌圣生物科技(上海)股份有限公司 重组TET酶MBD3-NgTET1及其在提高TET酶氧化产物中5caC占比的应用
CN114591440A (zh) * 2021-10-18 2022-06-07 翌圣生物科技(上海)股份有限公司 重组TET酶MBD4-NgTET1及其在提高TET酶氧化产物中5caC占比的应用
CN114591440B (zh) * 2021-10-18 2023-06-20 翌圣生物科技(上海)股份有限公司 重组TET酶MBD4-NgTET1及其在提高TET酶氧化产物中5caC占比的应用
CN114591441B (zh) * 2021-10-18 2023-06-20 翌圣生物科技(上海)股份有限公司 重组TET酶MBD3-NgTET1及其在提高TET酶氧化产物中5caC占比的应用
CN114540325A (zh) * 2022-01-17 2022-05-27 广州医科大学 靶向dna去甲基化的方法、融合蛋白及其应用
CN114540325B (zh) * 2022-01-17 2022-12-09 广州医科大学 靶向dna去甲基化的方法、融合蛋白及其应用

Also Published As

Publication number Publication date
WO2021169925A1 (zh) 2021-09-02

Similar Documents

Publication Publication Date Title
WO2021169925A1 (zh) 一种融合蛋白及其应用
CN109797157B (zh) 一种抗非生物逆境转录因子PbrbHLH92及其引物、编码的蛋白和应用
CN110526993A (zh) 一种用于基因编辑的核酸构建物
CN111172173A (zh) 降低玉米株高或延迟开花的方法
CN107759676B (zh) 一种植物直链淀粉合成相关蛋白Du15与其编码基因及应用
CN110804090B (zh) 蛋白质CkWRKY33及其编码基因与应用
CN110592134A (zh) 一种sdg40基因或其编码蛋白的应用
CN107326035B (zh) 一种调控水稻粒型和叶色的去泛素化酶基因ubp5及其应用
JP4863602B2 (ja) 完全長cDNAを用いた総合的遺伝子機能解析の植物システム
CN114292855B (zh) 一种调控杨树木质部发育的PagARR9基因及其应用
CN114657157B (zh) ZmD13蛋白在调控玉米株高中的应用
CN116179589A (zh) SlPRMT5基因及其蛋白在调控番茄果实产量中的应用
CN112852865B (zh) OaAn-1蛋白、编码基因及其相关生物材料的应用
CN109207485A (zh) OsAPS1基因在改良水稻抗病性中的应用
CN112662687B (zh) 推迟玉米花期的方法、试剂盒、基因
CN114686456A (zh) 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN111560055B (zh) 水稻基因OsLAT3在调节敌草快的吸收累积中的应用
CN113242906A (zh) Tpst基因在调控植物性状中的应用
CN104498504B (zh) 花生AhRRS22基因及其在烟草抗青枯病中的应用
CN109355270A (zh) 一种水稻激酶osk1及其应用
CN114672493B (zh) 一种用ZmPHT1;7蛋白或其编码基因培育抗旱植物的方法
CN113215156B (zh) 一种利用CRISPR/Cas9技术高效创制香味玉米的方法
CN112661823B (zh) 改变玉米开花期的基因及方法
CN113846120B (zh) 蛋白质TaTIN103在调控小麦分蘖中的应用
CN111019968B (zh) NTS/dNTS组合在制备植物突变体中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination