CN113473845A - 经由基因组编辑进行基因沉默 - Google Patents

经由基因组编辑进行基因沉默 Download PDF

Info

Publication number
CN113473845A
CN113473845A CN201980080395.1A CN201980080395A CN113473845A CN 113473845 A CN113473845 A CN 113473845A CN 201980080395 A CN201980080395 A CN 201980080395A CN 113473845 A CN113473845 A CN 113473845A
Authority
CN
China
Prior art keywords
nuclease
sequence
dna
gene
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980080395.1A
Other languages
English (en)
Inventor
吕建
陈希
于鲲
梁大伟
周红菊
许建平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Crop Protection AG Switzerland
Syngenta Biotechnology China Co Ltd
Original Assignee
Syngenta Crop Protection AG Switzerland
Syngenta Biotechnology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Crop Protection AG Switzerland, Syngenta Biotechnology China Co Ltd filed Critical Syngenta Crop Protection AG Switzerland
Publication of CN113473845A publication Critical patent/CN113473845A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及通过基因组编辑进行基因沉默的方法和组合物。在一些实施例中,提供了选自由以下组成的组的核酸酶:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9‑FokI、dCpf1‑FokI、嵌合Cas9/Cpf1‑胞嘧啶脱氨酶、嵌合Cas9/Cpf1‑腺嘌呤脱氨酶、嵌合FEN1‑FokI、和Mega‑TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。此外,本发明涉及通过基因组编辑进行基因沉默的方法和组合物。还提供了通过基因组编辑来重排染色体的方法和组合物。

Description

经由基因组编辑进行基因沉默
相关申请
本申请要求于2018年12月4日提交的PCT/CN2018/119155的权益,并且通过援引以其全文特此并入。
序列表
以ASCII文本格式的序列表,该序列表是根据37C.F.R.§1.821提交的,名称为“81724_ST25.txt”,大小为47千字节,于2018年11月19日生成。这个序列表特此通过引用以其披露内容并入本说明书中。
技术领域
本发明涉及通过基因组编辑使基因沉默或通过基因组编辑使染色体重排的方法和组合物。
背景技术
基因沉默是作物中研究基因功能和递送关键性状的关键工具。植物中基因沉默的传统策略包括(Cold Spring Harb Symp Quant Biol.[冷泉港数量生物学研讨会]2006;71:481-5)有义RNA转录物的转基因过表达、发夹转录物的转基因表达、反义RNA转录物的转基因表达。同时,这些技术也存在一些局限性。对于过度产生的有义转录物,转录物应无提前终止密码子,否则效果不够好且不稳定。而对于发夹和反义设计,在相同组织和相同发育阶段的沉默RNA与天然靶mRNA的匹配表达是不可能的;所以RNA沉默效应是有漏洞的(leaky)。
本披露提供了使用基因组编辑来产生染色体倒位的新颖的基因沉默方法。基因组编辑尚未用于基因沉默,除了将转录调节因子靠近要沉默的基因的启动子,如WO18057863、WO 2017180915、和WO 2017023974中。
发明内容
本披露提供了降低靶基因表达的方法,该方法包括以下:将能够在靶基因组位点定点DNA切割的核酸酶引入细胞、在单个靶基因内进行两个或更多个双链切割、选择双链切割已被修复且中间DNA反向的细胞、并减少靶基因的表达。在一些实施例中,核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。在该方法的一些实施例中,靶基因中的双链切割位于启动子、UTR、外显子、内含子或基因-基因连接区。当细胞具有单倍体、二倍体、多倍体或六倍体基因组时可以使用这些方法。当靶基因是显性、隐性或半显性时,可以使用这些方法。在一些实施例中,该方法可以利用一个、两个或更多个指导序列。这种方法对于植物细胞有用,但适用于任何细胞。
本披露提供了通过基因组编辑重排染色体的方法,包括通过定点核酸酶在染色体中产生至少一个断裂、选择具有重排的染色体。在一些实施例中,该方法可以利用选自由以下组成的组的定点核酸酶:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。在该方法的一些实施例中,染色体重排包括缺失、复制、倒位或易位。在该方法的一些实施例中,染色体重排引起基因表达的修饰。在该方法的一些实施例中,基因表达修饰包括在前体mRNA水平、或在成熟mRNA水平或在翻译水平上的调节。在该方法的一些实施例中,当染色体可以归入一个核中(例如在种间杂种中)时,染色体重排包括来自两个物种的染色体。在该方法的一些实施例中,染色体重排经由将至少两个等位基因或来自不同等位基因的两个成分融合而导致新的等位基因产生。在该方法的一些实施例中,染色体重排靶向启动子、外显子、内含子或转录终止子。在该方法的一些实施例中,染色体重排导致与重排的基因具有序列相似性的不同基因的基因表达的修饰。在该方法的另外的实施例中,缺失、重复、倒位或易位不少于19个碱基对。
附图说明
图1是具有构建体22602(左)(其中Exon5中的两次编辑导致事件RIET142202A130A中的缺失或事件RIET142202A049A中的倒位)以及具有构建体22604(右)的转化事件的表示(其中Exon5中的两次编辑导致事件RIET142300A014A中的缺失或在事件RIET142500B024A049A中的倒位)的转化事件的图示。
图2显示了从内源基因座测量DEP1表达的工作流程。
图3是来自事件RIET142202A130A的T1种子基因分型的PCR产物的凝胶电泳。
图4是与具有DEP1中缺失的植物邻近的野生型水稻植物。
图5是取样用于RNA分离的2-3cm水稻植物。
图6是来自FI植物17SBC500140、17SBC500143、17SBC500146、和17SBC500149的rtPCR产物的凝胶电泳。
图7是F1植物中DEP1的外显子5的图示,具有缺失或插入(上图)以及通过凝胶电泳分离的rtPCR产物(下图),将DEP1产物量化并归一化为水稻泛素基因OS03g0234200的表达比率。
图8是来自E0植物(RIET142500A084A)的DEP1的外显子5的图示,鉴定为具有两个易位。
图9是显示了如何使用两个或更多个基因组编辑靶标来选择染色体易位和重复的示意图。
图10是显示倒位如何导致基因沉默的示意图。
图11是显示如何使用染色体倒位来沉默六倍体或多倍体基因组中的基因直系同源物的示意图。
序列表中的序列简述
SEQ ID NO.1是密集并且竖起的穗1的编码序列
SEQ ID NO.2是来自载体22603的gRNA-B和gRNA-D表达盒
SEQ ID NO.3是靶向DEP1的外显子5的指导RNA-B
SEQ ID NO.4是也靶向外显子5的gRNA-D
SEQ ID NO.5是22604gRNA-A、gRNA-D、gRNA-B、和gRNA-C
SEQ ID NO.6是指导RNA-A
SEQ ID NO.7是指导RNA-C
SEQ ID NO.8是CAS9表达盒
SEQ ID NO.9是CAS9 Taqman测定正向引物
SEQ ID NO.10是CAS9 Taqman测定反向引物
SEQ ID NO.11是CAS9 Taqman测定探针
SEQ ID NO.12是gRNA-A Taqman测定正向引物
SEQ ID NO.13是gRNA-A Taqman测定反向引物
SEQ ID NO.14是gRNA-A Taqman测定探针
SEQ ID NO.15是gRNA-C Taqman测定正向引物
SEQ ID NO.16是gRNA-C Taqman测定反向引物
SEQ ID NO.17是gRNA-C Taqman测定探针
SEQ ID NO.18是gRNA-D Taqman测定正向引物
SEQ ID NO.19是gRNA-D Taqman测定反向引物
SEQ ID NO.20是gRNA-D Taqman测定探针
SEQ ID NO.21是DEP1 PCR引物1
SEQ ID NO.22是DEP1 PCR引物2
SEQ ID NO.23是RNA-A与RNA-B之间的倒位
SEQ ID NO.24是gRNA-B与gRNA-D之间的缺失
SEQ ID NO.25是gRNA-A与gRNA-B之间的倒位
SEQ ID NO.26是RIET142300A014A,被选为表达对照
SEQ ID NO.27是14SBC500773的有义基因分型引物
SEQ ID NO.28是14SBC500773的反义基因分型引物
SEQ ID NO.29是DEP1 qRT-PCR有义引物,位于外显子1
SEQ ID NO.30是DEP1 qRT-PCR反义引物,位于3’UTR
SEQ ID NO.31是水稻泛素(Os03g0234200)qRT-PCR引物1
SEQ ID NO.32是水稻泛素(Os03g0234200)qRT-PCR引物2
SEQ ID NO.33是野生型DEP1 qRT-PCR引物1
SEQ ID NO.34是野生型DEP1 qRT-PCR引物2
SEQ ID NO.35是gRNA-A与gRNA-B、gRNA-C与gRNA-D之间的易位
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。此外,鉴于本披露内容,本文建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在本文的发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。本文提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全文并入本文。
提供下面的定义和方法以便更好地定义本发明并且在本发明的实践中指导本领域的普通技术人员。除非另外说明,本文使用的术语应该根据相关领域的那些一般技术人员的常规用法来理解。分子生物学中的一般术语的定义也可在Rieger等人,Glossary of Genetics:Classical and Molecular[遗传学词汇表:标准和分子],第5版,Springer-Verlag,New York[施普林格出版社:纽约],1994中找到。
如在本发明的实施例的说明和所附权利要求中所使用的,单数形式“一个/一种(a/an)”和“该(the)”旨在也包括复数形式,除非上下文清楚地另外指明。
如本文使用的,“和/或”是指并且涵盖相关列出项目中的一个或多个的任何和所有可能的组合。
如本文使用的术语“约”当指代可测量的值如化合物的量、剂量、时间、温度等时意指涵盖指定量的20%、10%、5%、1%、0.5%、或甚至0.1%的变化。
术语“包含(comprise、comprises和/或comprising)”当在本说明书中使用时,指明所列举特征、整体、步骤、操作、元件、和/或组分的存在,但是不排除一种或多种其他特征、整体、步骤、操作、元件、组分、和/或其组的存在或添加。
如本文使用的,过渡短语“基本上由……组成”意指权利要求的范围将被解释为涵盖该权利要求中所提到的指定材料或步骤以及不实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。
如本文使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。参见例如Diagnostic MolecularMicrobiology:Principles and Applications[诊断分子微生物学:原理与应用],D.H.Persing等人编著,American Society for Microbiology[美国微生物学会],华盛顿哥伦比亚特区(1993)。扩增产物被称为扩增子。
“编码序列”是转录成RNA(例如mRNA、rRNA、tRNA、snRNA、有义RNA或反义RNA)的核酸序列。在一些实施例中,该RNA随后在生物体内被翻译以产生蛋白质。
如在此所使用的术语转基因的“事件”是指一种通过用异源DNA(例如,包括一个或多个目的基因(例如,转基因)的表达盒)转化和再生单个植物细胞而产生的重组植物。术语“事件”是指包含异源DNA的原始转化体和/或该转化体的子代。术语“事件”也是指通过该转化体和另一种品系之间进行有性远交(outcross)而产生的子代。即使在重复回交至一个轮回亲本后,来自该转化的亲本的插入DNA和侧翼DNA存在于在该杂交子代的同样的染色体位置。通常,植物组织的转化产生多个事件,每个上述事件代表DNA构建体插入至植物细胞的基因组中的不同位置中。基于转基因或其他期望的特征的表达,选择特定的事件。因而,如在此所使用的“事件MIR604”、“MIR604”或“MIR604事件”意指原始的MIR604转化体和/或MIR604转化体的子代(美国专利号7,361,813;7,897,748;8,354,519和8,884,102,通过引用结合在此)。
如本文使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列表达的核酸分子,该核酸分子包括可操作地连接至目的核苷酸序列(典型地是编码区)的启动子,该核苷酸序列可操作地连接至终止信号。它还典型地包含适当翻译该核苷酸序列所需要的序列。该编码区通常对目的蛋白质进行编码,但是还可以在正义或反义方向上对目的功能性RNA(例如反义RNA或非翻译RNA)进行编码。表达盒还可以包含在指导目的核苷酸序列表达中不需要的序列,但是其因为用于将表达盒从表达载体移除的方便的限制性位点而存在。包含目的核苷酸序列的表达盒可以是嵌合的,意味着至少一个它的组分相对于至少一个它的其他组分是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,通常表达盒相对于宿主来说是异源的,即表达盒的特定核酸序列在宿主细胞中不是天然存在的,并且必须已经通过本领域已知的转化方法引入至宿主细胞或宿主细胞的祖先中。在该表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下,该启动子只有当该宿主细胞暴露于一些特定的外界刺激时才引发转录。在多细胞生物体(例如植物)的情况下,该启动子对于特定组织、或器官、或者发育阶段也可以是特异的。当被转化进植物中时,表达盒或其片段也可被称为“插入的序列”或者“插入序列”。
“基因”是位于基因组内的限定区域,并且除了前述的编码核酸序列之外,它还包括其他负责控制该编码部分的表达(也就是转录和翻译)的主要调节性核酸序列。基因可以包括编码区和非编码区(例如、内含子、调节元件、启动子、增强子、终止序列和5'和3'非翻译区)二者。基因典型地表达mRNA、功能性RNA、或特异性蛋白,包括调节序列。基因可能或可能不能用于产生功能性蛋白质。在一些实施例中,基因仅指编码区。术语“天然基因”是指如在自然界中发现的基因。术语“嵌合基因”是指包含以下各项的任何基因:1)DNA序列,包括在自然界中未一起发现的调节序列和编码序列,或2)编码不天然邻接的蛋白的部分的序列,或3)不天然邻接的启动子的部分。因此,嵌合基因可以包括从不同来源得到的调节序列和编码序列,或包括从相同来源得到的、但以与在自然界中所发现的不同的方式进行安排的调节序列和编码序列。基因可以是“分离的”,分离的基因意为一种核酸分子,其基本上(substantially或essentially)不含正常情况下发现与其天然状态时的核酸分子相关的组分。此类组分包括其他细胞材料、来自重组产物的培养基、和/或在化学合成该核酸分子中所使用的多种化学品。
关于多核苷酸编码序列的术语“表达(express或expression)”,意指该序列被转录,并且任选被翻译。
“目的基因”、“目的核苷酸序列”或“目的序列”是指当转移至植物时,在该植物上赋予所希望的特征(例如抗生素抗性、病毒抗性、昆虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁育能力)的任何基因。“目的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。
如本文使用的,“异源的”是指与其引入的宿主细胞天然不相关的核酸分子或核苷酸序列,该序列来源于另一种物种或来自相同物种或生物体,但是从其原始形式或主要在细胞中表达的形式进行了修饰,包括天然存在的核酸序列的非天然存在的多个拷贝。因此,源自与将其引入的细胞所属的生物体或物种不同的生物体或物种的核苷酸序列相对于那个细胞或细胞的子代而言是异源的。另外,异源核苷酸序列包括一种核苷酸序列,该核苷酸序列源自并插入相同的天然原始细胞类型,但是却以非天然状态存在,例如,以不同拷贝数目存在,和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。核酸序列还可以异源于与其相关的其他核酸序列,例如在核酸构建体中,例如像表达载体。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,这些调节元件和/或编码序列不与那个特定启动子相关地天然存在,即它们与该启动子是异源的。
“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序列。同源核酸序列还可以与其他核酸序列天然相关的核酸序列,这些其他核酸序列可以例如存在于核酸构建体中。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,这些调节元件和/或编码序列与那个特定启动子相关地天然存在,即它们与该启动子是同源的。
“可操作地连接”是指在一个单个核酸序列上核酸序列的关联,这样使得一个的功能影响另一个的功能。例如,当一个启动子能够影响编码序列或者功能RNA的表达时(即该编码序列或功能RNA处于该启动子的转录控制之下),则该启动子与该编码序列或者功能RNA是可操作地连接的。正义方向或者反义方向的编码序列能够与调节序列可操作地连接。因此,可操作地与核苷酸序列相关的调节或控制序列(例如,启动子)能够影响核苷酸序列的表达。例如,与编码GFP的核苷酸序列可操作地连接的启动子将能够影响该GFP核苷酸序列的表达。
控制序列不需要与目的核苷酸序列相邻,只要它们起到指导其表达的作用。因此,例如,介入未翻译的、已转录的序列可以在启动子与编码序列之间存在,并且该启动子序列仍可以被认为“可操作地连接至”该编码序列上。
如本文使用的“引物”是分离的核酸,它们通过核酸杂交被退火为互补靶DNA链,以在该引物与该靶DNA链之间形成杂交,然后通过一种聚合酶(如DNA聚合酶)沿着该靶DNA链延长。引物对或引物组可以用于核酸分子的扩增,例如通过聚合酶链式反应(PCR)或者其他核酸扩增方法。
“探针”是互补于靶核酸分子的一部分的分离的核酸分子,并且典型地用于检测和/或定量靶核酸分子。因此,在一些实施例中,探针可以是可检测部分或报道基因附接到的分离的核酸分子,如放射性同位素、配体、化学发光剂、荧光剂或酶。根据本发明的探针不仅可以包括脱氧核糖核酸或核糖核酸,还包括与靶核酸序列特异性结合并且可以用于检测该靶核酸序列的存在或定量该靶核酸序列的量的聚酰胺类以及其他探针材料。
设计TaqMan探针,使得其在由特定引物组扩增的DNA区域内退火。由于Taq聚合酶延伸引物并从互补链的3'至5'的单链模板合成新生链,所以聚合酶的5'至3'外切核酸酶通过探针延伸新生链,并且因此降解已经退火到模板的探针。探针的降解从其中释放荧光团,并打破了与淬灭剂的紧密相接,从而减轻了淬灭效应并允许荧光团的荧光。因此,在定量PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。
引物和探针的长度一般在5和100个核苷酸或更多核苷酸之间。在一些实施例中,引物和探针的长度可以为至少20个核苷酸或更多,或至少25个核苷酸或更多,或长度至少30个核苷酸或更多。这些引物和探针在本领域已知的最佳杂交条件下与靶序列特异性杂交。根据本发明的引物和探针可以具有与该靶序列互补的完整序列,虽然与该靶序列不同并保留与该靶序列杂交的能力的探针可通过根据本发明的常规方法进行设计。
用于制备和使用探针和引物的方法描述于例如Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],第2版,第1-3卷,Sambrook等人编辑,ColdSpring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约州,1989中。PCR引物对可以源自已知序列,例如通过使用旨在用于该目的的计算机程序。
聚合酶链式反应(PCR)是一种用于“扩增”特定DNA片段的技术。为了进行PCR,必须知道待复制的DNA分子的核苷酸序列的至少一部分。通常,使用与待扩增的DNA的每条链的3'端处的核苷酸序列(已知序列)互补(例如,基本互补或完全互补)的引物或短寡核苷酸。将DNA样品加热以分离其链,并与这些引物混合。这些引物与其DNA样品中的互补序列杂交。使用原始DNA链作为模板开始合成(5'至3'方向)。该反应混合物必须包含全部四种脱氧核苷酸三磷酸(dATP、dCTP、dGTP和dTTP)和DNA聚合酶。聚合继续进行,直到每条新合成的链已经进行得足够远以包含被另一个引物识别的序列。一旦发生这种情况,就会产生与原始分子相同的两个DNA分子。将这两个分子加热以分离其链,并重复该过程。每个循环使DNA分子的数量加倍。使用自动化设备,每个循环的复制可以在不到5分钟内完成。30个循环后,以DNA单分子开始的扩增已经超过10亿个拷贝(230=1.02x109)。
寡核苷酸引物对的寡核苷酸互补于位于相对DNA链上和待扩增区域侧翼的DNA序列。退火引物与新合成的DNA链杂交。第一个扩增循环将导致两条新的DNA链,其5’端通过寡核苷酸引物的位置固定,但其3’端是可变的(‘不规则的’3’端)。两条新链可以依次充当用于合成所希望的长度的互补链的模板(5’端由引物定义并且3’端是固定的,因为合成不能超过相反引物的末端)。几个循环后,所希望的固定长度产品开始占主导地位。
定量聚合酶链式反应(qPCR)(也称为实时聚合酶链式反应)实时监测来自PCR反应的DNA产物的积累。qPCR是基于聚合酶链式反应(PCR)的分子生物学实验室技术,它用于扩增并且同时定量靶DNA分子。可以在PCR中扩增和检测特定序列的甚至一个拷贝。PCR反应以指数方式生成DNA模板的拷贝。这导致起始靶序列的量和在任何特定循环下累积的PCR产物的量之间的定量关系。由于与模板、试剂限制或焦磷酸盐分子的积累一起发现的聚合酶反应的抑制剂,所以PCR反应最终停止以指数速率生成模板(即平台期),使得PCR产物的终点定量不可靠。因此,重复的反应可以生成可变量的PCR产物。只有在PCR反应的指数期期间才有可能回推以便确定模板序列的起始量。PCR产物积累时的测量(即实时定量PCR)允许在反应的指数期进行定量,并且因此消除与常规PCR相关的变异性。在实时PCR测定中,通过荧光信号积累来检测阳性反应。对于DNA样品中的一个或多个特异性序列,定量PCR能够进行检测和定量二者。数量可以是拷贝的绝对数量或是当归一化到DNA输入或额外的归一化基因时的相对量。从实时PCR的第一次记录以来,它已被用于越来越多的并且不同数量的应用,包括mRNA表达研究、基因组或病毒DNA中的DNA拷贝数测量、等位基因辨别测定、基因的特异性剪接变体的表达分析和石蜡包埋组织中的基因表达以及激光捕获的显微切割细胞。
如在此所使用的,短语“Ct值”是指“循环阈值”,其被定义为“扩增靶标的量达到固定阈值的分数循环数”。在一些实施例中,其表示扩增曲线和阈值线之间的交点。扩增曲线典型地处于“S”形,这表示在给定循环(X轴)处的每个反应(Y轴)的相对荧光的变化,该变化在一些实施例中通过实时PCR仪器在PCR期间记录。在一些实施例中,阈值线是反应达到高于背景的荧光强度处的检测水平。参见Livak和Schmittgen(2001)25Methods[《方法》]402-408。它是PCR中靶标浓度的相对量度。通常,在一些实施例中,对于给定的参考基因,定量测定如qPCR的良好Ct值在10-40的范围内。Ct水平与样品中的靶核酸量成反比(即Ct水平越低,样品中的可检测的靶核酸量越高)。此外,定量测定如qPCR的良好Ct值显示出在成比例稀释靶gDNA的情况下的线性响应范围。
在一些实施例中,在其中可以实时收集Ct值进行定量分析的条件下进行qPCR。例如,在典型的qPCR实验中,在延伸期期间的PCR的每个循环处监测DNA扩增。当DNA处于扩增的对数线性期时,荧光的量通常增加到背景以上。在一些实施例中,在该时间点收集Ct值。
如本文使用的,术语“细胞”是指任何活细胞。该细胞可以是原核细胞或真核细胞。该细胞可以是分离的。该细胞可能能够或可能不能够再生成生物体。该细胞可以是在组织、愈伤组织、培养物、器官、或部分的上下文中。在一些实施例中,该细胞可以是植物细胞。本发明的植物细胞可以处于分离的单细胞形式,或者可以是培养的细胞,或者可以是作为较高级的组织单位(例如像,植物组织或植物器官)的一部分。该植物细胞可以源自被子植物或裸子植物或是它们的一部分。在另外的实施例中,该植物细胞可以是单子叶植物细胞、双子叶植物细胞。该单子叶植物细胞可以是例如玉蜀黍、水稻、高粱、甘蔗、大麦、小麦、燕麦、草皮草、或观赏草细胞。该双子叶植物细胞可以是例如烟草、胡椒、茄子、向日葵、十字花科植物、亚麻、马铃薯、棉花、大豆、甜菜、或油菜细胞。
如在此所使用的术语“植物部分”包括但不限于:胚、花粉、胚珠、种子、叶、茎、芽、花、枝、果实、果仁、穗、穗轴、果壳、茎杆、根、根尖、花药、植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团等。如本文使用的,“芽”是指包括叶和茎的地上部分。此外,如本文使用的,“植物细胞”是指植物的结构和生理单位,包括细胞壁并且也可以指原生质体。
在细胞、原核细胞、细菌细胞、真核细胞、植物细胞、植物和/或植物部分的上下文中,术语“引入”(introducing或introduce)意指将核酸分子与该细胞、真核细胞、植物、植物部分和/或植物细胞以这样一种方式相接触,使得该核酸分子得以进入细胞、真核细胞、植物细胞和/或植物和/或植物部分的细胞的内部。在引入多于一种核酸分子的情况下,这些核酸分子可以被装配成单个聚核苷酸或核酸构建体的一部分,或装配成分开的聚核苷酸或核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单个的转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分,将这些多核苷酸引入到植物细胞中。
“倒位”是染色体重排,其中染色体的区段首尾相连。当单个染色体在自身内部发生断裂和重排时,就会发生倒位。染色体“易位”是非同源染色体之间的部分的重排。
如本文使用的,术语“转化”和“转基因”是指包含至少一种重组(例如,异源)多核苷酸的全部或部分的任何细胞、原核细胞、真核细胞、植物、植物细胞、愈伤组织、植物组织、或植物部分。在一些实施例中,将该重组多核苷酸的全部或部分稳定地整合到染色体或稳定的染色体外元件中,以便使得其传递到连续世代。出于本发明的目的,术语“重组多核苷酸”是指已经通过基因工程予以改变、重排或修饰的多核苷酸。实例包括任何克隆的多核苷酸,或与异源序列连接或接合的多核苷酸。术语“重组”不是指因天然存在的事件(如自发突变)或因非自发诱变随后选择性育种而产生的多核苷酸改变。
如本文使用的术语“转化”是指将异源核酸引入细胞中。细胞的转化可以是稳定或瞬时的。因此,本发明的转基因细胞、植物细胞、植物和/或植物部分可以被稳定转化或瞬时转化。术语“转化”可以指将核酸分子转移到宿主细胞的基因组中,导致基因上稳定的遗传。在一些实施例中,引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制,或其任何组合进行的。
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下方式转化:细菌介导的核酸递送(例如,经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制,包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人,(“Procedures for Introducing Foreign DNAinto Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology andBiotechnology[植物分子生物学和生物技术]的方法中,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司],波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外源DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人,1993,Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌,一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元载体转移至农杆菌中(
Figure BDA0003100638010000161
和Willmitzer,1988,Nucleic Acids Res.[核酸研究]16:9877)。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如,干燥的酵母细胞、干燥的细菌或噬菌体,各自包含一个或多个试图被引入的核酸)推进到植物组织中。
在多核苷酸的上下文中,“瞬时转化”意指:将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。
如本文使用的,在被引入细胞中的多核苷酸的上下文中,“稳定引入(stablyintroducing、stably introduced)”、“稳定转化(stable transformation或stablytransformed)”意指:引入的多核苷酸被稳定地整合到该细胞的基因组中,并且因此该细胞用该多核苷酸稳定地转化。因此,整合的多核苷酸能够由其子代继承,更具体地说,由多个连续世代的子代继承。如本文使用的“基因组”包括核和/或质体基因组,并且因此包括多核苷酸到例如叶绿体基因组中的整合。如本文使用的稳定转化还可以是指被保持在染色体外,例如,作为微染色体的多核苷酸。
瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测,这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如,植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测,该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列,导致该一个或多个靶序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。
因此,在本发明的具体实施例中,植物细胞可以通过本领域内已知的任何方法并且如本文描述进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。在以下文献中描述了从植物细胞、植物组织培养物和/或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,MacMilan Publishing Co.[麦克米兰出版公司],纽约(1983));以及VasilI.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第I卷(1984)和第II卷(1986))。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。
“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如本文使用的,转化和再生包括选择过程,通过该过程转基因包括选择性标记,并且转化的细胞已经并入并表达转基因,使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。
术语“核苷酸序列”、“核酸”、“核酸序列”、“核酸分子”“寡核苷酸”以及“多核苷酸”在此可互换地使用来指核苷酸的杂聚物并且涵盖RNA和DNA二者,包括cDNA、基因组DNA、mRNA、合成的(例如,化学合成的)DNA或RNA以及RNA和DNA的嵌合体。术语核酸分子是指核苷酸链,而不考虑该链的长度。这些核苷酸包含糖、磷酸和碱,该碱是嘌呤或嘧啶。核酸分子可以是双链或单链的。在单链时,核酸分子可以是正义链或反义链。可以使用寡核苷酸类似物或衍生物(例如,肌苷或硫代磷酸核苷酸)合成核酸分子。此类寡核苷酸可以例如用于制备具有改变的碱基配对能力或对核酸酶的增强的抗性的核酸分子。在此提供的核酸序列在此以5'至3'方向从左至右表示,并且使用代表核苷酸字符的标准代码表示,如美国序列规则,37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述。
“核酸片段”是给定核酸分子的一部分。“RNA片段”是给定的RNA分子的一部分。“DNA片段”是给定的DNA分子的一部分。“核酸区段”是给定的核酸分子的一部分并且并不是从该分子分离的。“RNA区段”是给定的RNA分子的一部分并且并不是从该分子分离的。“DNA区段”是给定的DNA分子的一部分并且并不是从该分子分离的。多核苷酸的区段可以是任何长度,例如长度为至少5、10、15、20、25、30、40、50、75、100、150、200、300或500或更多个核苷酸。指导序列的区段或一部分可以是该指导序列的约50%、40%、30%、20%、10%,例如该指导序列的三分之一或更短,例如长度为7、6、5、4、3、或2个核苷酸。
在分子的上下文中,术语“源自”是指使用亲本分子或来自该亲本分子的信息,分离或制造的分子。例如,Cas9单突变体切口酶和Cas9双突变体无效核酸酶源自野生型Cas9蛋白。
在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)涉及将DNA中包含的信息到蛋白中的转移。“基因组”是在生物体的每个细胞中所包含的遗传物质的整体。除非另外表明,本发明的特定的核酸序列还暗示性地涵盖其保守地修饰的变体(例如,简并密码子取代)以及互补序列、以及连同明确地指明的序列。具体地,简并密码子取代可以通过产生如下序列而获得,在这些序列中,一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核酸研究]19:5081(1991);Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985);和Rossolini等人,Mol.Cell.Probes[分子与细胞探针]8:91-98(1994))。术语核酸分子与基因、cDNA和由基因编码的mRNA可互换使用。
如本文使用的“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分(例如,核苷酸或氨基酸)的整个比对窗口内不变的程度。“同一性”可以通过已知方法容易地计算出,这些方法包括但不限于以下文献中描述的那些:Computational Molecular Biology[计算分子生物学](Lesk,A.M.,编辑)Oxford University Press[牛津大学出版社],纽约(1988);Biocomputing:Informatics and Genome Projects[生物计算:信息学和基因组项目](Smith,D.W.,编辑)Academic Press[学术出版社],纽约(1993);Computer Analysisof Sequence Data[序列数据的计算机分析],第I部分(Griffin,A.M.和Griffin,H.G.编辑)Humana Press[胡马纳出版社],新泽西(1994);Sequence Analysis in Molecular Biology[分子生物学的序列分析])(von Heinje,G.编辑)学术出版社(1987);和Sequence Analysis Primer[序列分析引物](Gribskov,M.和Devereux,J.编辑)斯托克顿出版社,纽约(1991)。
如本文使用的,术语“序列同一性百分比”或“同一性百分比”是指在最佳比对两个序列时,与测试(“主题”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的同一核苷酸的百分比。在一些实施例中,“同一性百分比”可以是指氨基酸序列中同一氨基酸的百分比。
如本文使用的,在两个核酸分子、核苷酸序列或蛋白质序列上下文中,短语“基本上同一”是指当比较并比对最大对应性时具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。在本发明的一些实施例中,在长度为至少约50个残基至约150个残基的序列区域上存在基本同一性。因此,在本发明的一些实施例中,在长度为至少约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、或更多个残基的序列区域上存在实质一致性。在一些具体实施例中,这些序列在至少约150个残基上是基本上同一的。在另外的实施例中,序列在编码区的整个长度上是基本上同一的。此外,在代表性实施例中,基本上同一的核苷酸序列或蛋白序列进行基本上相同的功能(例如指导至具体的基因组靶表、具体的基因组靶位点的内切核酸酶切割)。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(若有必要,则指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施:如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,并且任选地由这些算法的计算机化实现方式来实施,如作为
Figure BDA0003100638010000201
Wisconsin
Figure BDA0003100638010000202
(材料科学软件公司(Accelrys Inc.),圣地亚哥,加利福尼亚州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的已比对区段的“同一性分数”是由两个已比对序列所共有的同一组分的数目除以参考序列区段(即,完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列同一性百分比被表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其部分,或相对于较长的多核苷酸序列。出于本发明的目的,也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN确定“同一性百分比”。
用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开地获得。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈值(Altschul等人,1990)。这些最初的邻域字命中点作为种子,用于启动搜索以找到包含它们的更长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积得分。对于氨基酸序列,使用评分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间相似性的统计分析(参见,例如Karlin和Altschul,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,如果在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.1至小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。因此,在本发明的一些实施例中,在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.001。
当两个核苷酸序列在严格条件下彼此杂交时,这两个核苷酸序列也可以被认为是基本上同一的。在一些代表性实施例中,被认为基本上同一的两个核苷酸序列在高严格条件下彼此杂交。
在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。对核酸杂交的广泛指导见于以下:Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy ofnucleic acid probe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔],纽约(1993)。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。用于互补核苷酸序列(它们在DNA或RNA印迹中在滤器上具有超过100个互补残基)的杂交的严格杂交条件的一个实例是在42℃下具有1mg肝素的50%甲酰胺,其中杂交是过夜进行的。高严格洗涤条件的一个实例是0.15MNaCl,在72℃持续约15分钟。严格洗涤条件的实例是在65℃以0.2x SSC洗涤持续15分钟(参见Sambrook,下文,针对SSC缓冲液的描述)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如多于100个核苷酸的双链体的中严格洗涤的实例是在45℃以1x SSC持续15分钟。对于例如多于100个核苷酸的双链体的低严格性洗涤的一个实例是在40℃下以4-6x SSC进行15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐),并且温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,在特定的杂交测定中相比于不相关的探针观察到的高出2x(或更高)的信噪比表明检测到特异性杂交。如果在严格条件下彼此不杂交的核苷酸序列所编码的蛋白质是基本上同一的,则这些核苷酸序列仍然是基本上同一的。例如,当使用遗传密码所允许的最大密码子简并性来生成核苷酸序列的拷贝时,这种情况可能发生。
以下是可以用来克隆同源核苷酸序列(这些序列是与本发明的参考核苷酸序列基本上同一的)的杂交/洗涤条件的设置的实例。在一个实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在2X SSC、0.1%SDS中洗涤。在另一个实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在1X SSC、0.1%SDS中洗涤;或者在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,同时在50℃在0.5X SSC、0.1%SDS中洗涤。在仍另外的实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在0.1X SSC、0.1%SDS中洗涤;或者在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中杂交,同时在65℃在0.1X SSC、0.1%SDS中洗涤。
“分离的”核酸分子或核苷酸序列或“分离的”多肽是借助于人的手脱离其天然环境存在的和/或当与其在其天然环境中的功能相比时具有不同的、修饰的、调节的和/或改变的功能的并且因此不是天然的产物的核酸分子、核苷酸序列或多肽。分离的核酸分子或分离的多肽能以纯化形式存在或可以存在于非天然环境(例如像重组宿主细胞)中。因此,例如,相对于多核苷酸而言,术语分离的意指将该多核苷酸从它天然存在于其中的染色体和/或细胞中分离出。如果将一种多核苷酸从它天然存在于其中的染色体和/或细胞中分离出并且然后将其插入它并不天然存在于其中的遗传背景、染色体、染色体位置、和/或细胞中,则该多核苷酸也是被分离的。本发明的重组核酸分子和核苷酸序列可以被认为是如上文所定义的“分离的”。
因此,“分离的核酸分子”或“分离的核苷酸序列”是核酸分子或核苷酸序列,该核酸分子或核苷酸序列不与在其衍生而来的生物体的天然存在的基因组中的与其邻近的核苷酸序列(位于5'端的序列或位于3’端的序列)相邻。因此,在一个实施例中,一个分离的核酸包括一些或全部的5'非编码(例如,启动子)序列,这些序列紧接编码序列。因此,该术语包括,例如,重组核酸,该重组核酸并入载体、并入自我复制的质粒或病毒、或并入原核生物或真核生物的基因组DNA,或者它作为独立于其他序列的单独分子(例如,cDNA或通过PCR或限制性内切核酸酶处理而得到的基因组DNA片段)而存在。它也包括作为编码额外多肽或肽序列的杂合核酸分子的部分的重组核酸。“分离的核酸分子”或“分离的核苷酸序列”还可以包括以下核苷酸序列,该核苷酸序列源自并插入相同的天然原始细胞类型,但是却以非天然状态存在,例如,以不同拷贝数目存在,和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。
术语“分离的”可以进一步指核酸分子、核苷酸序列、多肽、肽或片段,它们实质上不含细胞材料、病毒材料、和/或培养基(例如,当通过重组DNA技术生产时)、或化学前体或其他化学品(例如,当进行化学合成时)。另外,“分离的片段”是不作为片段天然存在并且不会在天然状态下如此存在的核酸分子、核苷酸序列或多肽的片段。“分离的”不必须意味着该制备是工业纯的(同质的),但是它是足够纯的以提供处于一种可以用于预期目的形式的多肽或核酸。
在本发明的代表性实施例中,“分离的”核酸分子、核苷酸序列和/或多肽具有是至少约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99%纯(w/w)或更纯。在其他实施例中,“分离的”核酸、核苷酸序列和/或多肽表示与起始材料相比,实现该核酸的至少约5倍、10倍、25倍、100倍、1000倍、10,000倍、100,000倍或更大富集(w/w)。
“野生型”核苷酸序列或氨基酸序列是指天然存在(“天然”)或内源核苷酸序列或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中的或对生物体来说是內源性的mRNA。“同源”核苷酸序列是与它被引入的宿主细胞天然相关的核苷酸序列。
术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(“密码子”)的一个单位,它对应地指明蛋白合成(mRNA翻译)的起始和链终止。
“启动子”是指核苷酸序列,通常在它的编码序列的上游(5'),它通过提供对适当的转录所需的RNA聚合酶以及其他因子的识别来控制该编码序列的表达。“启动子调节序列”由近端和更远端上游元件组成。启动子调节序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括自然序列以及合成序列、连同可能是合成序列与自然序列的组合的序列。“增强子”是一个DNA序列,它可以刺激启动子的活性并且可以是该启动子或插入的异源元件的一个固有元件以增强一种启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作,并且甚至当移动到该启动子的上游或下游时还能够发挥作用。术语“启动子”的含义包括“启动子调节序列”。
“初级转化株”以及“T0世代”是指与最初转化(即,自从转化起未经历减数分裂以及受精)的组织具有相同遗传世代的转基因植物。“次级转化株”以及“T1、T2、T3等世代”是指经由一个或多个减数分裂以及受精循环而源自初级转化株的转基因植物。它们可以通过初级或次级转化株的自体受精或初级或次级转化株与其他转化或未转化植物的杂交衍生的。
“转基因”是指核酸分子,该核酸分子已经通过转化被引入该基因组中并且被稳定地保持。转基因可以包括至少一个表达盒,典型地包括至少两个表达盒,并且可以包括十个或更多个表达盒。转基因可以包括例如对于待转化的特定植物的基因而言是异源的或者是同源的基因。此外,转基因可以包括被插入非天然生物体中的天然基因,或嵌合基因。术语“内源基因”是指在生物体的基因组中在它的天然位置中的天然基因。“外源”基因是指正常在宿主生物体中未发现但通过基因转移被引入该生物体中的基因。
“内含子”是指几乎唯一地在真核基因中发生的DNA的内插区段,但该内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子,该剪接使外显子未被触及,从而形成mRNA。出于本发明的目的,术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰,条件是该修饰过的内含子没有显著地降低其关联的5’调节序列的活性。
“外显子”是指携带蛋白或其一部分的编码序列的DNA的区段。外显子被内插的、非编码序列(内含子)分离。出于本发明的目的,术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰,条件是该修饰过的外显子没有显著地降低它的关联的5’调节序列的活性。
术语“切割(cleavage或cleaving)”是指多核苷酸的核糖基磷酸二酯主链中的共价磷酸二酯键联的断裂。术语“切割(cleavage或cleaving)”涵盖单链断裂和双链断裂二者。作为两次不同的单链切割事件的结果,可以发生双链切割。切割可以导致产生平末端或交错末端。“核酸酶切割位点”或“基因组核酸酶切割位点”是包括核酸酶切割序列的核苷酸区域,该核酸酶区域由特异性核酸酶识别,该核酸酶用于切割一条或两条链中基因组DNA的核苷酸序列。由核酸酶的这种切割引发了细胞内的DNA修复机制,它建立了同源重组发生的环境。
“供体分子”或“供体序列”是旨在用于在靶多核苷酸(典型地靶基因组位点)处进行插入的核苷酸聚合物或低聚物。供体序列可以是一个或多个目的转基因、表达盒、或核苷酸序列。供体分子可以是供体DNA分子,是单链的、部分双链的、或双链的。供体多核苷酸可以是天然的或修饰的多核苷酸,RNA-DNA嵌合体,或DNA片段,单链的、或至少部分双链的、或完全双链的DNA分子,或PGR扩增的ssDNA,或至少部分dsDNA片段。在一些实施例中,供体DNA分子是环化DNA分子的一部分。完全双链的供体DNA是有利的,因为它可能提供增加的稳定性,因为与ssDNA相比,对于核酸酶降解,dsDNA片段通常更具有抗性。在一些实施例中,供体多核苷酸分子可以包含至少约100、150、200、250、300、250、400、450、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、7500、10000、15,000或20,000个核苷酸,包括此范围内的未在此明确叙述的任何值。在一些实施例中,供体DNA分子包含异源核酸序列。在一些实施例中,供体DNA分子包含至少一个表达盒。在一些实施例中,供体DNA分子可以包含转基因,该转基因包含至少一个表达盒。在一些实施例中,供体DNA分子包含原于靶基因组的基因的等位基因修饰。该等位基因修饰可以包含至少一个核苷酸插入、至少一个核苷酸缺失、和/或至少一个核苷酸取代。在一些实施例中,该等位基因修饰可以包含插入缺失(INDEL)。在一些实施例中,供体DNA分子包含与靶基因组位点同源的臂。在一些实施例中,供体DNA分子包含与基因组核酸序列具有至少90%同一性的至少100个连续核苷酸,并且任选地可以进一步包含异源核酸序列,例如转基因。
如本文使用的,关于本发明的一个或多个核苷酸序列的术语“邻近的”或“与……邻近”意指紧邻(例如,没有插入序列)或由从约1个碱基至约500个碱基(例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100、200、250、300、350、400、450、或500个碱基)分隔,包括包含在该范围内但未在此明确叙述的任何值。
如本文使用的,术语“指导RNA”或“gRNA”通常是指可以与CRISPR系统效应物(如Cas或Cpf1蛋白)结合并帮助将Cas或Cpf1蛋白靶向靶多核苷酸(例如DNA)内的特定位置的RNA分子(或总RNA分子的组)。本发明的指导RNA可以是工程化的单RNA分子(sgRNA),其中例如sgRNA包含crRNA区段和任选的tracrRNA区段。本发明的指导RNA也可以是双指导系统,其中crRNA和tracrRNA分子是物理上不同的分子,然后相互作用形成双链体,用于募集CRISPR系统效应物(如Cas9),并用于将该蛋白质靶向靶多核苷酸。
如本文使用的,术语“crRNA”或“crRNA区段”是指RNA分子或RNA分子的部分,其包括多核苷酸靶向指导序列、参与蛋白质结合的茎干序列(stem sequence)和任选的3'-突出端序列。多核苷酸靶向指导序列是与靶DNA中的序列互补的核酸序列。此多核苷酸靶向指导序列也称为“前间隔序列”。换句话说,靶向crRNA分子的指导序列的多核苷酸以序列特异性方式,经由杂交(即碱基配对)与靶DNA相互作用。如此,crRNA分子的多核苷酸靶向指导序列的核苷酸序列可以变化,并且决定了指导RNA和靶DNA将发生相互作用的靶DNA内的位置。
crRNA分子的多核苷酸靶向指导序列可以被修饰(例如通过基因工程),从而与靶DNA内的任何所希望的序列杂交。本发明的crRNA分子的多核苷酸靶向指导序列可以具有从约12个核苷酸至约100个核苷酸的长度。例如,crRNA的多核苷酸靶向指导序列可以具有以下长度:从约12个核苷酸(nt)至约80个nt、从约12个nt至约50个nt、从约12个nt至约40个nt、从约12个nt至约30个nt、从约12个nt至约25个nt、从约12个nt至约20个nt、或从约12个nt至约19个nt。例如,crRNA的多核苷酸靶向指导序列可以具有从约17个nt至约27个nt的长度。例如,crRNA的多核苷酸靶向指导序列可以具有以下长度:从约19个nt至约20个nt、从约19个nt至约25个nt、从约19个nt至约30个nt、从约19个nt至约35个nt、从约19个nt至约40个nt、从约19个nt至约45个nt、从约19个nt至约50个nt、从约19个nt至约60个nt、从约19个nt至约70个nt、从约19个nt至约80个nt、从约19个nt至约90个nt、从约19个nt至约100个nt、从约20个nt至约25个nt、从约20个nt至约30个nt、从约20个nt至约35个nt、从约20个nt至约40个nt、从约20个nt至约45个nt、从约20个nt至约50个nt、从约20个nt至约60个nt、从约20个nt至约70个nt、从约20个nt至约80个nt、从约20个nt至约90个nt、或从约20个nt至约100个nt。crRNA的多核苷酸靶向指导序列的核苷酸序列可以具有至少约12个nt的长度。在一些实施例中,crRNA的多核苷酸靶向指导序列的长度是20个核苷酸。在一些实施例中,crRNA的多核苷酸靶向指导序列的长度是19个核苷酸。
本发明还提供了包含工程化crRNA的指导RNA,其中该crRNA包含能够与基因组靶序列杂交的诱饵(bait)RNA区段。此工程化的crRNA可以是物理上不同的分子,就像在双引导系统中一样。
如本文使用的,术语“tracrRNA”或“tracrRNA区段”是指RNA分子或其部分,其包括蛋白质结合区段(例如,蛋白质结合区段能够与CRISPR相关蛋白(如Cas9)相互作用)。本发明还提供了包含工程化的tracrRNA的指导RNA,其中该tracrRNA进一步包含能够与供体DNA分子结合的诱饵RNA区段。工程化的tracrRNA可以是物理上不同的分子(如在双引导系统中)、或者可以是sgRNA分子的区段。
在一些实施例中,作为sgRNA或作为两个或更多个RNA分子的指导RNA不含有tracrRNA,因为本领域已知一些CRISPR相关的核酸酶(如Cpf1(也称为Cas12a))因其RNA介导的内切核酸酶活性而不需要tracrRNA(Qi等人,2013,Cell[细胞],152:1173-1183;Zetsche等人,2015,Cell[细胞]163:759-771)。本发明的此类指导RNA可以包含crRNA,其中诱饵RNA可操作地连接在crRNA的5'或3'端。Cpf1还对其同源pre-crRNA具有RNA酶活性(Fonfara等人,2016,Nature[自然],doi.org/10.1038/nature17945)。本发明的指导RNA可以包含其中Cpf1具有的成熟crRNA的多个crRNA。在一些实施例中,这些crRNA中的每一个均与诱饵RNA可操作地连接。在其他实施例中,这些crRNA中的至少一个与诱饵RNA可操作地连接。诱饵RNA可以对目的序列(SOI)具有特异性(如图1所示并且如本文实例中所述)、或者它可以是“通用”诱饵,其在供体DNA分子上具有相应的“通用”猎物序列(prey sequence)(如图2所示和本文实例中所述)。
本发明还提供了包含编码本发明的指导RNA的核酸序列的核酸分子。该核酸分子可以是DNA或RNA分子。在一些实施例中,该核酸分子是环化的。在其他实施例中,该核酸分子是直链的。在一些实施例中,该核酸分子是单链的、部分双链的、或双链的。在一些实施例中,核酸分子与至少一个多肽复合。该多肽可以具有核酸识别结构域或核酸结合结构域。在一些实施例中,多肽是用于介导例如本发明的嵌合RNA、核酸酶和任选的供体分子的递送的穿梭物。在一些实施例中,多肽是Feldan穿梭物(美国专利公开号20160298078,通过引用并入本文)。核酸分子可以包含能够驱动嵌合RNA表达的表达盒。核酸分子还可以包含额外的表达盒,其能够表达例如核酸酶(如CRISPR相关核酸酶)。本发明还提供了包含编码本发明的嵌合RNA的核酸序列的表达盒。
“定点修饰多肽”修饰靶DNA(例如靶DNA的切割或甲基化)和/或与靶DNA缔合的多肽(例如组蛋白尾的甲基化或乙酰化)。定点修饰多肽在本文也称为“定点多肽”或“RNA结合定点修饰多肽”。由于定点修饰多肽与指导RNA的缔合,定点修饰多肽与指导RNA相互作用(该指导RNA是单个RNA分子或至少两个RNA分子的RNA双链体),并被引导至DNA序列(例如染色体序列或染色体外序列,例如游离体序列、微环序列、线粒体序列、叶绿体序列等)。
在一些情况下,定点修饰多肽是天然存在的修饰多肽。在其他情况下,定点修饰多肽不是天然存在的修饰多肽(例如嵌合多肽或被修饰的(例如突变、缺失、插入)的天然存在的多肽)。示例性天然存在的定点修饰多肽是本领域已知的(参见例如Makarova等人,2017,Cell[细胞]168:328-328.e1,和Shmakov等人,2017,Nat Rev Microbiol[自然微生物学综述]15(3):169-182,这两篇文献均通过引用并入本文)。这些天然存在的多肽结合DNA靶向RNA,并且由此被指导至靶DNA内的特定序列,并且切割靶DNA,从而产生双链断裂。
定点修饰多肽包含两个部分,即RNA结合部分和活性部分。在一些实施例中,定点修饰多肽包含:(i)与DNA靶向RNA相互作用的RNA结合部分,其中该DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列;和(ii)展现出定点酶活性(例如DNA甲基化活性、DNA切割活性、组蛋白乙酰化活性、组蛋白甲基化活性等)的活性部分,其中由DNA靶向RNA决定酶活性的位点。在其他实施例中,定点修饰多肽包含:(i)与DNA靶向RNA相互作用的RNA结合部分,其中该DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列;和(ii)调节靶DNA内的转录(例如增加或减少转录)的活性部分,其中由DNA靶向RNA决定靶DNA内的调节的转录的位点。
在一些情况下,定点修饰多肽具有修饰靶DNA的酶活性(例如核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、去氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性)。在其他情况下,定点修饰多肽具有修饰与靶DNA缔合的多肽(例如组蛋白)的酶活性(例如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或去豆蔻酰化活性)。
在一些情况下,不同定点修饰多肽,例如不同Cas9蛋白(即来自多种物种的Cas9蛋白)可以有利地用于多种本发明提供的方法,用来利用不同Cas9蛋白的多种酶特征(例如用于不同PAM序列偏好;用于增加或减少的酶活性;用于增加或减少的细胞毒性水平;用于改变NHEJ、同源定向修复、单链断裂、双链断裂等之间的平衡)。来自多种物种的Cas9蛋白(例如,Shmakov等人,2017中披露的那些,或源自其的多肽)可能需要靶DNA中的不同PAM序列。因此,对于选择的特定Cas9酶,PAM序列要求可能不同于已知对于Cas9活性所需要的5'-NGG-3’序列(其中N是A、T、C、或G)。本文已经鉴定了来自多种多样的物种的许多Cas9直系同源物,并且该蛋白仅共享少数相同的氨基酸。所有鉴定的Cas9直系同源物具有与中央HNH内切核酸酶结构域和分开的RuvC/RNA酶H结构域相同的结构域构造。Cas9蛋白共享具有保守构造的4个关键基序;基序1、2、和4是RuvC样基序,而基序3是HNH基序。
定点修饰多肽还可以是嵌合的和修饰的Cas9核酸酶。例如,它可以是修饰的Cas9“碱基编辑器”。碱基编辑使得能够以可编程方式将一个靶DNA碱基直接不可逆转变为另一个碱基,而不需要DNA切割或供体DNA分子。例如,Komor等人(2016,Nature[自然],533:420-424)教导了Cas9-胞苷脱氨酶融合,其中也已经将Cas9工程化为无活性的,并且并不诱导双链DNA断裂。此外,Gaudelli等人(2017,Nature[自然],doi:10.1038/nature24644)教导了融合至tRNA腺苷脱氨酶的催化活性削弱的Cas9,它可以介导靶DNA序列中A/T至G/C的转变。可以充当本发明的方法和组合物中的定点修饰多肽的另一类工程化的Cas9核酸酶是识别广范围的PAM序列(包括NG、GAA、和GAT)的变体(Hu等人,2018,Nature[自然],doi:10.1038/nature26155)。
任何Cas9蛋白(包括那些天然存在的和/或从天然存在的Cas9蛋白突变或修饰的那些)可以用作本发明的方法和组合物中的定点修饰多肽。具有催化活性的Cas9核酸酶切割靶DNA,从而产生双链断裂。然后由细胞按以下两种方式之一修复这些断裂:非同源末端连接、和同源定向修复。
在非同源末端连接(NHEJ)中,通过断裂端彼此直接连接,修复双链断裂。如此,没有新核酸材料插入该位点,尽管一些核酸材料可以失去,导致缺失。在同源定向修复中,将与切割的靶DNA序列同源的供体DNA分子用作模板,用于切割的靶DNA序列的修复,导致遗传信息从供体多核苷酸转移至靶DNA。如此,可以将新核酸材料插入/拷贝到该位点。在一些情况下,使靶DNA与供体分子(例如供体DNA分子)接触。在一些情况下,将供体DNA分子引入细胞中。在一些情况下,供体DNA分子的至少一个区段整合到细胞的基因组中。
归因于NHEJ和/或同源定向修复对靶DNA进行修饰导致例如基因修正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。因此,在不存在外源提供的供体多核苷酸的情况下,通过切割靶DNA序列并且允许细胞修复该序列,由定点修饰多肽切割DNA可以用于从靶DNA序列缺失核酸材料(例如用来破坏使细胞易于感染的基因(例如CCR5或CXCR4基因,它们使T细胞易于被HIV感染),用于去除神经元中的致病三核苷酸重复序列,用于产生基因敲除和突变作为研究的疾病模型等)。因此,主题方法可以用于敲除基因(导致转录的完全缺乏或转录改变),或用于将遗传材料敲入靶DNA中的选择的基因座中。可替代地,如果用至少包括与靶DNA序列同源的区段的供体分子将DNA靶向RNA双链体和定点修饰多肽共同施用至细胞,则可以使用主题方法用于添加,即插入或置换核酸材料至靶DNA序列(例如用来“敲入”编码蛋白、siRNA、miRNA等的核酸),用于添加标记(例如6xHis、荧光蛋白(例如绿色荧光蛋白;黄色荧光蛋白等)、血球凝集素(HA)、FLAG等),用于添加调节序列至基因(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等),用于修饰核酸序列(例如引入突变)等。如此,包含DNA靶向RNA双链体和定点修饰多肽的复合物可用于任何体外或体内应用,在这些应用中,希望以位点特异性的,即“靶向的”方式修饰DNA,例如基因敲除、基因敲入、基因编辑、基因标记等,如用于例如基因疗法(例如用于治疗疾病),或者作为抗病毒、抗病原、或抗癌治疗剂,在农业中产生基因修饰生物体,由细胞大规模产生蛋白,用于治疗、诊断、或研究目的,诱导iPS细胞,生物研究,靶向病原体的基因用于缺失或置换等。
术语“CRISPR相关蛋白”、“Cas蛋白”、“CRISPR相关核酸酶”或“Cas核酸酶”是指野生型Cas蛋白、其片段、或其突变体或变体。术语“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白或多肽衍生物,例如具有一个或多个点突变、插入、缺失、截短、融合蛋白、或其组合的蛋白。在某些实施例中,Cas突变体或Cas变体基本上保留了Cas蛋白的核酸酶活性,例如与源自植物的核定位信号(NLS)可操作地连接的本文描述的Cas9变体。在某些实施例中,将Cas核酸酶突变,使得一个或两个核酸酶结构域无活性,例如像不具有催化活性的Cas9称为dCas9,它仍然能够靶向特定基因组位置,但是不具有内切核酸酶活性(Qi等人,2013,Cell[细胞],152:1173-1183,特此并入本文)。在一些实施例中,将Cas核酸酶突变,使得它缺乏其野生型对应物的一些或全部核酸酶活性。Cas蛋白可以是Cas9、Cpf1(Zetsche等人,2015,Cell[细胞],163:759-771,特此并入本文)或任何另一种CRISPR相关核酸酶。
a.本发明提供了使靶基因基因沉默的方法,该方法包括以下:将能够在靶基因组位点定点DNA切割的核酸酶引入细胞、在单个靶基因内进行两个或更多个双链切割、选择双链切割已被修复且中间DNA反向的细胞、并沉默靶基因的表达。
在一些实施例中,本发明提供了上述方法,进一步包括将包含编码抗沉默多肽的核苷酸序列的第三核酸分子引入细胞。在一些实施例中,可以向细胞提供抗沉默多肽。在一些实施例中,抗沉默蛋白是病毒沉默抑制子(VSR),或源自病毒沉默抑制子。在另外的实施例中,抗沉默蛋白是源自植物病毒的VSR。在另外的实施例中,抗沉默蛋白是病毒沉默抑制子p19蛋白,源自番茄丛矮病毒(Tombus virus),例如CymRSV、CIRV、或TBSV。Zhu等人最近表示,与指导RNA和Cas9核酸酶共表达的源自番茄茂密矮小病毒(Tomato Bushy StuntVirus)的p19 VSR改进了植物中的基因靶向效率和/或指导RNA稳定性(美国专利公开号2016/0264982)。在一些实施例中,VSR选自植物病毒蛋白的组,包括HC-Pro、p14、p38、NSs、NS3、CaMV P6、PNS10、P122、2b、Potex p25、ToRSV CP、P0、和SPMMV P1(参见Csorba等人,2015,Virology[病毒学]479-480第85-103页,通过引用并入本文)。
在一些实施例中,本发明提供了上述方法,其中第二核酸分子编码定点修饰多肽。在另外的实施例中,定点修饰多肽是核酸酶。在仍另外的实施例中,定点修饰多肽是核酸酶,即内切酶核酸,例如大范围核酸酶、锌指核酸酶或TALEN。在一些实施例中,核酸酶是RNA指导的内切核酸酶。在仍另外的实施例中,核酸酶是CRISPR相关的核酸酶,例如Cas9或Cpf1或Cas9或Cpf1的突变变体(例如核酸酶失活的突变变体)、或Cas9或CpfI的至少一个结构域与在不同定点修饰多肽的至少一个结构域之间的融合。
在一些实施例中,本发明提供了上述方法,进一步包括将包含编码抗沉默多肽的核苷酸序列的第三核酸分子引入细胞。在一些实施例中,抗沉默蛋白是病毒沉默抑制子(VSR),或源自病毒沉默抑制子。在另外的实施例中,抗沉默蛋白是源自植物病毒的VSR。在另外的实施例中,抗沉默蛋白是病毒沉默抑制子p19蛋白,源自番茄丛矮病毒(Tombusvirus),例如CymRSV、CIRV、或TBSV。Zhu等人最近表示,与指导RNA和Cas9核酸酶共表达的源自番茄茂密矮小病毒(Tomato Bushy Stunt Virus)的p19 VSR改进了植物中的基因靶向效率和/或指导RNA稳定性(美国专利公开号2016/0264982)。在一些实施例中,VSR选自植物病毒蛋白的组,包括HC-Pro、p14、p38、NSs、NS3、CaMV P6、PNS10、P122、2b、Potex p25、ToRSVCP、P0、和SPMMV P1(参见Csorba等人,2015,Virology[病毒学]479-480第85-103页,通过引用并入本文)。
本披露提供了降低靶基因表达的方法,该方法包括以下:将能够在靶基因组位点定点DNA切割的核酸酶引入细胞、在单个靶基因内进行两个或更多个双链切割、选择双链切割已被修复且中间DNA反向的细胞、并减少靶基因的表达。在一些实施例中,核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。在该方法的一些实施例中,靶基因中的双链切割位于启动子、UTR、外显子、内含子或基因-基因连接区。当细胞具有单倍体、二倍体、多倍体或六倍体基因组时可以使用这些方法。当靶基因是显性、隐性或半显性时,可以使用这些方法。在一些实施例中,该方法可以利用一个、两个或更多个指导序列。这种方法对于植物细胞有用,但适用于任何细胞。
本披露提供了通过基因组编辑重排染色体的方法,包括通过定点核酸酶在染色体中产生至少一个断裂、选择具有重排的染色体。在一些实施例中,该方法可以利用选自由以下组成的组的定点核酸酶:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。在该方法的一些实施例中,染色体重排包括缺失、复制、倒位或易位。在该方法的一些实施例中,染色体重排引起基因表达的修饰。在该方法的一些实施例中,基因表达修饰包括在前体mRNA水平、或在成熟mRNA水平或在翻译水平上的调节。在该方法的一些实施例中,当染色体可以归入一个核中(例如在种间杂种中)时,染色体重排包括来自两个物种的染色体。在该方法的一些实施例中,染色体重排经由将至少两个等位基因或来自不同等位基因的两个成分融合而导致新的等位基因产生。在该方法的一些实施例中,染色体重排靶向启动子、外显子、内含子或转录终止子。在该方法的一些实施例中,染色体重排导致与重排的基因具有序列相似性的不同基因的基因表达的修饰。在该方法的另外的实施例中,缺失、重复、倒位或易位不少于19个碱基对。
现在将参考以下实例描述本发明。应了解,这些实例并不旨在将权利要求书的范围限于本发明,而是旨在成为某些实施例的示例。可以由熟练的技术人员想到的示例性方法的任何变体都旨在落入本发明的范围内。
实例
实例1:通过基因组编辑进行基因倒位
为了通过基因组编辑测试基因倒位,在水稻(rice、Oryza sativa)的基因组中鉴定靶标。靶基因是密集并且竖起的穗1(DEP1、SEQ ID NO:1)。粳稻dep1突变体含有接近DEP1的3’端的625bp缺失。突变体具有密集并且竖起的穗,与野生型相比,具有更高谷物数量和更低植物高度(Huang等人,2009,Nat Genet[自然遗传学]41:494-497)。籼稻具有DEP1基因的野生型拷贝。对于本文描述的实例,通过基因组编辑的基因倒位作为DEP1的靶标。
二元载体22603包含表达盒(SEQ ID NO:2)(其产生靶向DEP1的外显子5的指导RNA-B(gRNA-B,gtccaagctgcggatgcaa,SEQ ID NO:3))和第二个表达盒(具有也靶向外显子5的gRNA-D(gtgccctgaatgttcctgt,SEQ ID NO:4))。二元载体22604包含表达盒(SEQ IDNO:5)(其产生指导RNA-A(actgcagtgcgtgctgcgc,SEQ ID NO:6)和第二表达盒(具有gRNA-D)、第三表达盒(其产生gRNA-B)和第四表达盒(其产生指导RNA-C(cccaatgcaaacccgattg,SEQ ID NO:7))。每个二元载体中的所有表达盒都是单个转基因的一部分。
本文描述的所有二元载体均包含用来表达Cas9内切核酸酶的表达盒(WO16106121,通过引用以其全文并入本文),和用来表达用于转化的选择性标记的第二表达盒。
将水稻近交系IR58025B用于基本上按照用于转化、选择、和再生的方案,进行农杆菌介导的转化实验,如在以下文献中所述:Gui等人2014(Plant Cell Rep[植物细胞报道]33:1081-1090,通过引用并入本文)。转基因水稻品系在具有16h光照/30℃和8h黑暗/22℃的温室中生长。
对来自T0转基因事件的叶组织取样,并且用于基因组DNA提取,随后进行TaqMan分析。TaqMan分析基本如Ingham等人描述的(Biotechniques[生物技术]31(1):132-4,136-40,2001)来进行,通过引用并入本文。进行TaqMan以检测Cas9基因的存在(表1,SEQ ID NO:9-10是引物;SEQ ID NO:11是探针);以及一系列Taqman测定靶向DEP1(SEQ ID NO:12-20)中的突变。为了检测DEP1中的突变,使正向引物和反向引物插入前间隔序列靶序列侧翼,并且使探针与包括Cas9切割位点和PAM的前间隔序列区域杂交。如果突变(典型地是插入缺失)引入到Cas9切割位点,则探针将不结合靶序列,并且因此不产生荧光(信号0)。基因型的表征基于DEP1的TaqMan分析(表2)。
表1.Taqman测定的SEQ ID NO
Figure BDA0003100638010000381
表2.基于Taqman分析的T0编辑的基因型
构建体 T0事件ID T0编辑模式 Cas9 gRNA-A gRNA-C gRNA-D
22603 RIET142202A130A 纯合缺失 >2 2 1 0
22603 RIET142202A049A 杂合倒位 >2 2 2 0
22604 RIET142300A014A 杂合缺失 >2 0 0 0
22604 RIET142500B024A 杂合倒位 >2 1 1 1
对来自T0事件的叶组织进行取样并用于基因组DNA提取。通过PCR使用引物5’-AAAGACCAAGGTGCCTCA-3’(SEQ ID NO:21)和5’-TGGTTCAACCTCGTCTCATA-3’(SEQ ID NO:22)扩增DEP1基因片段。通过凝胶电泳将PCR产物分离出目标大小,并克隆到pCR-Blunt载体(Invitrogen(英杰公司))中。使用位于pCR-Blunt载体中的M13正向和反向引物,使用Sanger测序方法对每个扩增子15-30个集落进行测序。使用Vector-NTI Advance 11(英杰公司)和BLAST分析两者,通过与野生型DEP1序列的比对来组装和分析序列。
RIET142202A049A和RIET142500B024A是两个在外显子5中发生倒位的编辑(图1)。在RIET142202A049A中,在gRNA-B与gRNA-D之间413bp片段反向(基因组序列,SEQ ID NO:23)。在接下来的表达研究中,选择来自相同构建体22603的RIET142202A130A作为对照,在gRNA-B与gRNA-D之间有444bp的缺失(基因组序列,SEQ ID NO:24)。在来自22604的编辑中,RIET142500B024A被鉴定具有gRNA-A与gRNA-B之间的倒位(基因组序列,SEQ ID NO:25)。类似地,进一步选择RIET142300A014A作为表达对照(基因组序列,SEQ ID NO:26)。
实例2:将突变的DEP1与野生型DEP1组合
当反向的DEP1存在时,为了检查野生型DEP1的表达,如图2设计工作流程。从自交的T0植物中收获T1种子,然后播种至发芽托盘在温室中用在16小时光照/30℃和8小时黑暗/22℃下持续2周。对来自T1植物的叶组织进行取样并用于基因组DNA提取。14SBC500773(RIET142202A130A的T1种子)的基因分型引物是5’-TCTTTGCTGCTGTTGCAAGT-3’(有义引物,SEQ ID NO:27)和5’-TCAACCACTGAGACAGCATGG-3’(反义引物,SEQ ID NO:28)。通过凝胶电泳分离PCR产物(图3)。类似的过程被应用于基因型其他事件。
在相同条件下将选择的T1植物转移到温室大盆中(图4)。同时播种58025颗野生型种子,并平行转移到大盆中。在开花期,采集58025B野生型植物的花粉,并将其与纯合缺失和反向的植物受精以产生F1种子(表3)。
表3.F1种子的谱系
构建体 T0事件ID T1种子ID F1种子ID F1植物基因型
22603 RIET142202A130A 14SBC500773 17SBC500140 WT/缺失
22603 RIET142202A049A 14SBC500839 17SBC500143 WT/倒位
22604 RIET142300A014A 14SBC500776 17SBC500146 WT/缺失
22604 RIET142500B024A 14SBC500929 17SBC500149 WT/倒位
实例3:比较野生型OsDEP1的表达
在早期孕穗期从F1植物中取样2-3cm幼穗(图5);从每种基因型中取样5-6个幼穗,逐个样品处理RNA分离和cDNA合成。根据标准方案经由Invitrogen TRIzolTM分离RNA,并经由SuperscriptTMIII第一链合成系统(英杰公司)合成cDNA。首先,我们确认两个DEP1等位基因在F1穗中转录。使用有义引物5’-CTGGAGGTGCAGATCCTGAG-3’(有义引物,位于外显子1中,SEQ ID NO:29)和5’-CTTCAATGGTTCAACCTCGTC-3’(反有义引物,位于3’UTR中,SEQ ID NO:30)(图6)。使用引物对,野生型58025B的扩增子大小为1467bp;在17SBC500140的F1植物中,有两条带(一条为野生型DEP1、一条为缺失444bp的DEP1)。在17SBC500146和17SBC500149中,两个等位基因的扩增子大小相似,与野生型DEP1扩增子相比有102bp的缺失。此外,通过集落测序证实了具有缺失和倒位的DEP1转录物的存在。
然后将来自相同基因型的每个样品的cDNA混合,并经由半qRT-PCR比较WT/缺失和WT/倒位之间的野生型DEP1表达。选择水稻泛素(Os03g0234200)用于表达对照,具有引物5’-CCAGCAGCGGCTGATCTTC-3’(SEQ ID NO:31)和5’-CAGGCGCGCATAGCATGAGAA-3’(SEQ IDNO:32)。设计野生型DEP1特异性引物组(5’-ATGGGCTGCCACCATGGATAA-3’(SEQ ID NO:33)和5’-CAGCTTGGAAGGCCACAG-3’(SEQ ID NO:34)用于扩增。将PCR产物经由凝胶电泳分离并通过AlphaImager HP软件给予面积大小进行定量。通过用具有倒位的F1中野生型DEP1条带的面积除以具有缺失的F1中野生型DEP1条带的面积计算表达率,然后通过泛素对照的表达比率进行调整(图7,表4)。两种类型的倒位能够降低野生型DEP1的表达。
表4
Figure BDA0003100638010000411
实例4:经由基因组编辑易位
与实例1中指示的过程相同,E0植物(RIET142500A084A)被鉴定具有两个易位(图8,SEQ ID NO:105、SEQ ID NO:35)。有两个片段从gRNA-A&-B区域以及gRNA-C&-D区域中释放出来,而不是在相同位置产生倒位。部分基因或整个基因(包括启动子和终止子区域)或多个基因可以易位到附近或另一条染色体中的新位置。经由靶向整个基因或多个基因易位,可以基于图9中的设计实现重复。然后一个或多个基因的表达可以用更多的拷贝被上调。另一方面,如果基因组形成两个物种并归入一个核,则可以经由基因组编辑实现等位基因交换。具有很多拷贝的复制过多也会导致基因沉默;像HA412(高油酸向日葵近交)一样,具有3个完整的HaFAD2-1拷贝,但没有表达。
基因的部分可以转移到同一区域或一个或多个新区域。对于同一区域的易位,可以产生部分重复或发夹环结构(图10)。在向日葵中,HaFAD2-1(ODS)的部分复制使完整的ODS基因沉默并导致籽粒中的高油酸(Mol Genet Genomics[分子遗传学和基因组学](2009)281:43-54);这也可以使杂交产生的其他野生型HaFAD2-1沉默。类似的设计可以提供非转基因的基因沉默工具。与TaMLO一样,经编辑的TaMLO-A可以沉默B和D等位基因的表达,这可以实现抗病性,但在三重突变中可以减轻生长损失(图11)。旁系同源基因也可以使用相同的策略在表达式中进行修饰。易位还可以融合基因并产生新基因或同一基因的新等位基因。
序列表
<110> Syngenta Participations, AG
Lv, Jian
Chen, Xi
Yu, Kun
Liang, Dawei
Zhou, Hongju
Xu, Jianping
<120> 经由基因组编辑进行基因沉默
<130> 81724-CN-REG-ORG-P-1
<160> 35
<170> PatentIn version 3.5
<210> 1
<211> 4174
<212> DNA
<213> 水稻
<400> 1
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgcgctgggt catgctgtag tccagactgc tgctcatgct 3300
gtaaacctaa ctgcagttgc tgcaagaccc cttcttgctg caaaccgaac tgctcgtgct 3360
cctgtccaag ctgcagctca tgctgcgata catcgtgctg caaaccgagc tgcacctgct 3420
tcaacatctt ttcatgcttc aaatccctgt acagctgctt caagatccct tcatgcttca 3480
agtcccagtg caactgctct agccccaatt gctgcacttg cacccatcca agctgtagct 3540
gcaagggctg tgcctgtcca agctgtggat ggcaacggct gtggctgtcc aagctgcgga 3600
tgcaacggtt gtggctgtcc aagctgcggt tgcaacggct gtggccttcc aagctgcggt 3660
tgcaacggct gcggctcgtg ctcttgcgcc caatgcaaac ccgattgtgg ctcgtgctct 3720
accaattgct gtagctgcaa gccaagctgc aacggctgct gcggcgagca gtgctgccgc 3780
tgcgcggact gcttctcctg ctcgtgccct cgtagctcca gctgcttcaa catcttcaaa 3840
tgctcctgcg ctggctgctg ctcgagcctg tgcaagtgcc cctgcacgac gcagtgcttc 3900
agctgccagt cgtcatgctg caagcggcag ccttcgtgct gcaagtgcca gtcgtcttgc 3960
tgcgaggggc agccttcctg ctgcgaggga cactgctgca gcctcccgaa accgtcgtgc 4020
cctgaatgtt cctgtgggtg tgtctggtct tgcaagaatt gtacagaggg ttgtcgatgc 4080
ccacggtgtc gtaacccatg ctgtctcagt ggttgcttat gttgatctag atcctttttt 4140
ggttgtcgtt tttcttgtat tttttagttg ttag 4174
<210> 2
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> 水稻
<400> 2
gggatcttta aacatacgaa cagatcactt aaagttcttc tgaagcaact taaagttatc 60
aggcatgcat ggatcttgga ggaatcagat gtgcagtcag ggaccatagc acaggacagg 120
cgtcttctac tggtgctacc agcaaatgct ggaagccggg aacactgggt acgttggaaa 180
ccacgtgatg tggagtaaga taaactgtag gagaaaagca tttcgtagtg ggccatgaag 240
cctttcagga catgtattgc agtatgggcc ggcccattac gcaattggac gacaacaaag 300
actagtatta gtaccacctc ggctatccac atagatcaaa gctggtttaa aagagttgtg 360
cagatgatcc gtggcagtcc aagctgcgga tgcaagtttt agagctagaa atagcaagtt 420
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttttt 480
<210> 3
<211> 19
<212> DNA
<213> 水稻
<400> 3
gtccaagctg cggatgcaa 19
<210> 4
<211> 19
<212> DNA
<213> 水稻
<400> 4
gtgccctgaa tgttcctgt 19
<210> 5
<211> 2222
<212> DNA
<213> 人工序列
<220>
<223> 水稻
<400> 5
gggatcttta aacatacgaa cagatcactt aaagttcttc tgaagcaact taaagttatc 60
aggcatgcat ggatcttgga ggaatcagat gtgcagtcag ggaccatagc acaggacagg 120
cgtcttctac tggtgctacc agcaaatgct ggaagccggg aacactgggt acgttggaaa 180
ccacgtgatg tggagtaaga taaactgtag gagaaaagca tttcgtagtg ggccatgaag 240
cctttcagga catgtattgc agtatgggcc ggcccattac gcaattggac gacaacaaag 300
actagtatta gtaccacctc ggctatccac atagatcaaa gctggtttaa aagagttgtg 360
cagatgatcc gtggcaactg cagtgcgtgc tgcgcgtttt agagctagaa atagcaagtt 420
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttttt 480
aagctttttg tgaaagttga attacggcat agccgaagga ataacagaat cgtttcacac 540
tttcgtaaca aaggtcttct tatcatgttt cagacgatgg aggcaaggct gatcaaagtg 600
atcaagcaca taaacgcatt tttttaccat gtttcactcc ataagcgtct gagattatca 660
caagtcacgt ctagtagttt gatggtacac tagtgacaat cagttcgtgc agacagagct 720
catacttgac tacttgagcg attacaggcg aaagtgtgaa acgcatgtga tgtgggctgg 780
gaggaggaga atatatacta atgggccgta tcctgatttg ggctgcgtcg gaaggtgcag 840
cccacgcgcg ccgtaccgcg cgggtggcgc tgctacccac tttagtccgt tggatgggga 900
tccgatggtt tgcgcggtgg cgttgcgggg gatgtttagt accacatcgg aaaccgaaag 960
acgatggaac cagcttataa acccgcgcgc tgtagtcagc ttggtgccct gaatgttcct 1020
gtgttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1080
gtggcaccga gtcggtgctt tttttttggg accggggatc tttaaacata cgaacagatc 1140
acttaaagtt cttctgaagc aacttaaagt tatcaggcat gcatggatct tggaggaatc 1200
agatgtgcag tcagggacca tagcacagga caggcgtctt ctactggtgc taccagcaaa 1260
tgctggaagc cgggaacact gggtacgttg gaaaccacgt gatgtggagt aagataaact 1320
gtaggagaaa agcatttcgt agtgggccat gaagcctttc aggacatgta ttgcagtatg 1380
ggccggccca ttacgcaatt ggacgacaac aaagactagt attagtacca cctcggctat 1440
ccacatagat caaagctggt ttaaaagagt tgtgcagatg atccgtggca gtccaagctg 1500
cggatgcaag ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1560
tgaaaaagtg gcaccgagtc ggtgcttttt ttttgggacc gtttgtgaaa gttgaattac 1620
ggcatagccg aaggaataac agaatcgttt cacactttcg taacaaaggt cttcttatca 1680
tgtttcagac gatggaggca aggctgatca aagtgatcaa gcacataaac gcattttttt 1740
accatgtttc actccataag cgtctgagat tatcacaagt cacgtctagt agtttgatgg 1800
tacactagtg acaatcagtt cgtgcagaca gagctcatac ttgactactt gagcgattac 1860
aggcgaaagt gtgaaacgca tgtgatgtgg gctgggagga ggagaatata tactaatggg 1920
ccgtatcctg atttgggctg cgtcggaagg tgcagcccac gcgcgccgta ccgcgcgggt 1980
ggcgctgcta cccactttag tccgttggat ggggatccga tggtttgcgc ggtggcgttg 2040
cgggggatgt ttagtaccac atcggaaacc gaaagacgat ggaaccagct tataaacccg 2100
cgcgctgtag tcagcttgcc caatgcaaac ccgattggtt ttagagctag aaatagcaag 2160
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt 2220
tt 2222
<210> 6
<211> 19
<212> DNA
<213> 水稻
<400> 6
actgcagtgc gtgctgcgc 19
<210> 7
<211> 19
<212> DNA
<213> 水稻
<400> 7
cccaatgcaa acccgattg 19
<210> 8
<211> 4962
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞杆菌, 玉蜀黍
<400> 8
agtcaaagat tcaaatagag gacctaacag aactcgccgt aaagactggc gaacagttca 60
tacagagtct cttacgactc aatgacaaga agaaaatctt cgtcaacttg gtggagcacg 120
acacgctagt ctactccaaa aatatcaaag atacagtctc agaagaccaa agggcaattg 180
agacttttca acaaagggta atatccggaa acctcctcgg attccattgc ccagctatct 240
gtcacttaat tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 300
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 360
cacccacgag gagcatcgtg gtaaaagaag acgttccaac cacgtcttca aagcaagtgg 420
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 480
acccttcctc tatataagga agttcatttc atttggagag gataattatc caccatggac 540
aagaagtaca gcatcggcct ggacatcggc accaacagcg tgggctgggc cgtgatcacc 600
gacgagtaca aggtgccgag caagaagttc aaggtgctgg gcaacaccga caggcacagc 660
atcaagaaga acctgatcgg cgccctgctg ttcgacagcg gcgagaccgc cgaggccacc 720
aggctgaaga ggaccgccag gaggaggtac accaggagga agaacaggat ctgctacctg 780
caggagatct tcagcaacga gatggccaag gtggacgaca gcttcttcca caggctggag 840
gagagcttcc tggtggagga ggacaagaag cacgagaggc acccgatctt cggcaacatc 900
gtggacgagg tggcctacca cgagaagtac ccgaccatct accacctgag gaagaagctg 960
gtggacagca ccgacaaggc cgacctgagg ctgatctacc tggccctggc ccacatgatc 1020
aagttcaggg gccacttcct gatcgagggc gacctgaacc cggacaacag cgacgtggac 1080
aagctgttca tccagctggt gcagacctac aaccagctgt tcgaggagaa cccgatcaac 1140
gccagcggcg tggacgccaa ggccatcctg agcgccaggc tgagcaagag caggaggctg 1200
gagaacctga tcgcccagct gccgggcgag aagaagaacg gcctgttcgg caacctgatc 1260
gccctgagcc tgggcctgac cccgaacttc aagagcaact tcgacctggc cgaggacgcc 1320
aagctgcagc tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc 1380
ggcgaccagt acgccgacct gttcctggcc gccaagaacc tgagcgacgc catcctgctg 1440
agcgacatcc tgagggtgaa caccgagatc accaaggccc cgctgagcgc cagcatgatc 1500
aagaggtacg acgagcacca ccaggacctg accctgctga aggccctggt gaggcagcag 1560
ctgccggaga agtacaagga gatcttcttc gaccagagca agaacggcta cgccggctac 1620
atcgacggcg gcgccagcca ggaggagttc tacaagttca tcaagccgat cctggagaag 1680
atggacggca ccgaggagct gctggtgaag ctgaacaggg aggacctgct gaggaagcag 1740
aggaccttcg acaacggcag catcccgcac cagatccacc tgggcgagct gcacgccatc 1800
ctgaggaggc aggaggactt ctacccgttc ctgaaggaca acagggagaa gatcgagaag 1860
atcctgacct tccgcatccc gtactacgtg ggcccgctgg ccaggggcaa cagcaggttc 1920
gcctggatga ccaggaagag cgaggagacc atcaccccgt ggaacttcga ggaggtggtg 1980
gacaagggcg ccagcgccca gagcttcatc gagaggatga ccaacttcga caagaacctg 2040
ccgaacgaga aggtgctgcc gaagcacagc ctgctgtacg agtacttcac cgtgtacaac 2100
gagctgacca aggtgaagta cgtgaccgag ggcatgagga agccggcctt cctgagcggc 2160
gagcagaaga aggccatcgt ggacctgctg ttcaagacca acaggaaggt gaccgtgaag 2220
cagctgaagg aggactactt caagaagatc gagtgcttcg acagcgtgga gatcagcggc 2280
gtggaggaca ggttcaacgc cagcctgggc acctaccacg acctgctgaa gatcatcaag 2340
gacaaggact tcctggacaa cgaggagaac gaggacatcc tggaggacat cgtgctgacc 2400
ctgaccctgt tcgaggacag ggagatgatc gaggagaggc tgaagaccta cgcccacctg 2460
ttcgacgaca aggtgatgaa gcagctgaag aggaggaggt acaccggctg gggcaggctg 2520
agcaggaagc tgatcaacgg catcagggac aagcagagcg gcaagaccat cctggacttc 2580
ctgaagagcg acggcttcgc caacaggaac ttcatgcagc tgatccacga cgacagcctg 2640
accttcaagg aggacatcca gaaggcccag gtgagcggcc agggcgacag cctgcacgag 2700
cacatcgcca acctggccgg cagcccggcc atcaagaagg gcatcctgca gaccgtgaag 2760
gtggtggacg agctggtgaa ggtgatgggc aggcacaagc cggagaacat cgtgatcgag 2820
atggccaggg agaaccagac cacccagaag ggccagaaga acagcaggga gaggatgaag 2880
aggatcgagg agggcatcaa ggagctgggc agccagatcc tgaaggagca cccggtggag 2940
aacacccagc tgcagaacga gaagctgtac ctgtactacc tgcagaacgg cagggacatg 3000
tacgtggacc aggagctgga catcaacagg ctgagcgact acgacgtgga ccacatcgtg 3060
ccgcagagct tcctgaagga cgacagcatc gacaacaagg tgctgaccag gagcgacaag 3120
aacaggggca agagcgacaa cgtgccgagc gaggaggtgg tgaagaagat gaaaaactac 3180
tggaggcagc tgctgaacgc caagctgatc acccagagga agttcgacaa cctgaccaag 3240
gccgagaggg gcggcctgag cgagctggac aaggccggct tcattaaaag gcagctggtg 3300
gagaccaggc agatcaccaa gcacgtggcc cagatcctgg acagcaggat gaacaccaag 3360
tacgacgaga acgacaagct gatcagggag gtgaaggtga tcaccctgaa gagcaagctg 3420
gtgagcgact tcaggaagga cttccagttc tacaaggtga gggagatcaa taattaccac 3480
cacgcccacg acgcctacct gaacgccgtg gtgggcaccg ccctgattaa aaagtacccg 3540
aagctggaga gcgagttcgt gtacggcgac tacaaggtgt acgacgtgag gaagatgatc 3600
gccaagagcg agcaggagat cggcaaggcc accgccaagt acttcttcta cagcaacatc 3660
atgaacttct tcaagaccga gatcaccctg gccaacggcg agatcaggaa gaggccgctg 3720
atcgagacca acggcgagac cggcgagatc gtgtgggaca agggcaggga cttcgccacc 3780
gtgaggaagg tgctgtccat gccgcaggtg aacatcgtga agaagaccga ggtgcagacc 3840
ggcggcttca gcaaggagag catcctgccg aagaggaaca gcgacaagct gatcgccagg 3900
aagaaggact gggatccgaa gaagtacggc ggcttcgaca gcccgaccgt ggcctacagc 3960
gtgctggtgg tggccaaggt ggagaagggc aagagcaaga agctgaagag cgtgaaggag 4020
ctggtgggca tcaccatcat ggagaggagc agcttcgaga agaacccagt ggacttcctg 4080
gaggccaagg gctacaagga ggtgaagaag gacctgatca ttaaactgcc gaagtacagc 4140
ctgttcgagc tggagaacgg caggaagagg atgctggcca gcgccggcga gctgcagaag 4200
ggcaacgagc tggccctgcc gagcaagtac gtgaacttcc tgtacctggc cagccactac 4260
gagaagctga agggcagccc ggaggacaac gagcagaagc agctgttcgt ggagcagcac 4320
aagcactacc tggacgagat catcgagcag atcagcgagt tcagcaagag ggtgatcctg 4380
gccgacgcca acctggacaa ggtgctgagc gcctacaaca agcacaggga caagccgatc 4440
agggagcagg ccgagaacat catccacctg ttcaccctga ccaacctggg cgccccggcc 4500
gccttcaagt acttcgacac caccatcgac aggaagaggt acaccagcac caaggaggtg 4560
ctggacgcca ccctgatcca ccagagcatc accggcctgt acgagaccag gatcgacctg 4620
agccagctgg gcggcgacag cagcccgccg aagaagaaga ggaaggtgag ctggaaggac 4680
gccagcggct ggagcaggat gtgaagcttg atcgttcaaa catttggcaa taaagtttct 4740
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 4800
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 4860
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 4920
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tc 4962
<210> 9
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞杆菌
<400> 9
ttgtgctgct ccacgaaca 19
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞杆菌
<400> 10
gccagccact acgagaagct 20
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 黄单胞杆菌
<400> 11
ctgcttctgc tcgttgtcct ccgg 24
<210> 12
<211> 17
<212> DNA
<213> 水稻
<400> 12
tgcgacgagc catgctg 17
<210> 13
<211> 23
<212> DNA
<213> 水稻
<400> 13
gcagtctgga ctacagcatg acc 23
<210> 14
<211> 13
<212> DNA
<213> 水稻
<400> 14
cagcgcagca cgc 13
<210> 15
<211> 18
<212> DNA
<213> 水稻
<400> 15
cttgcgccca atgcaaac 18
<210> 16
<211> 23
<212> DNA
<213> 水稻
<400> 16
gcagctacag caattggtag agc 23
<210> 17
<211> 14
<212> DNA
<213> 水稻
<400> 17
acgagccaca atcg 14
<210> 18
<211> 17
<212> DNA
<213> 水稻
<400> 18
cctcccgaaa ccgtcgt 17
<210> 19
<211> 24
<212> DNA
<213> 水稻
<400> 19
cgacaaccct ctgtacaatt cttg 24
<210> 20
<211> 16
<212> DNA
<213> 水稻
<400> 20
cacacccaca ggaaca 16
<210> 21
<211> 18
<212> DNA
<213> 水稻
<400> 21
aaagaccaag gtgcctca 18
<210> 22
<211> 20
<212> DNA
<213> 水稻
<400> 22
tggttcaacc tcgtctcata 20
<210> 23
<211> 4176
<212> DNA
<213> 水稻
<400> 23
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgcgctgggt catgctgtag tccagactgc tgctcatgct 3300
gtaaacctaa ctgcagttgc tgcaagaccc cttcttgctg caaaccgaac tgctcgtgct 3360
cctgtccaag ctgcagctca tgctgcgata catcgtgctg caaaccgagc tgcacctgct 3420
tcaacatctt ttcatgcttc aaatccctgt acaactgctt caagatccct tcatgcttca 3480
agtcccagtg caactgctct agccccaatt gctgcacttg cacccatcca agctgtagct 3540
gcaagggctg tgcctgtcca agctgtggat ggcaacggct gtggctgtcc aagctgcgga 3600
tgtggaacat tcagggcacg acggtttcgg gaggctgcag cagtgtccct cgcagcagga 3660
aggctgcccc tcgcagcaag acgactggca cttgcagcac gaaggctgcc gcttgcagca 3720
tgacgactgg cagctgaagc actgcgtcgt gcaggggcac ttgcacaggc tcgagcagca 3780
gccagcgcag gagcatttga agatgttgaa gcagctggag ctacgagggc acgagcagga 3840
gaagcagtcc gcgcagcggc agcactgctc gccgcagcag ccgttgcagc ttggcttgca 3900
gctacagcaa ttggtagagc acgagccaca atcgggtttg cattgggcgc aagagcacca 3960
gccgcagccg ttgcaaccgc agcttggaag gccacagccg ttggcaaccg cagcttggac 4020
agccacaacc gttgtgtggg tgtgtctggt cttgcaagaa ttgtacagag ggttgtcgat 4080
gcccacggtg tcgtaaccca tgctgtctca gtggttgctt atgttgatct agatcctttt 4140
ttggttgtcg tttttcttgt attttttagt tgttag 4176
<210> 24
<211> 3730
<212> DNA
<213> 水稻
<400> 24
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgcgctgggt catgctgtag tccagactgc tgctcatgct 3300
gtaaacctaa ctgcagttgc tgcaagaccc cttcttgctg caaaccgaac tgctcgtgct 3360
cctgtccaag ctgcagctca tgctgcgata catcgtgctg caaaccgagc tgcacctgct 3420
tcaacatctt ttcatgcttc aaatccctgt acaactgctt caagatccct tcatgcttca 3480
agtcccagtg caactgctct agccccaatt gctgcacttg cacccatcca agctgtagct 3540
gcaagggctg tgcctgtcca agctgtggat ggcaacggct gtggctgtcc aagctgtgtc 3600
tggtcttgca agaattgtac agagggttgt cgatgcccac ggtgtcgtaa cccatgctgt 3660
ctcagtggtt gcttatgttg atctagatcc ttttttggtt gtcgtttttc ttgtattttt 3720
tagttgttag 3730
<210> 25
<211> 4522
<212> DNA
<213> 水稻
<400> 25
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgcatccaca gcttggacag gcacagccct tgcagctaca 3300
gcttggatgg gtgcaagtgc agcaattggg gctagagcag ttgcactggg acttgaagca 3360
tgaagggatc ttgaagcagt tgtacaggga tttgaagcat gaaaagatgt tgaagcaggt 3420
gcagctcggt ttgcagcacg atgtatcgca gcatgagctg cagcttggac aggagcacga 3480
gcagttcggt ttgcagcaag aaggggtctt gcagcaactg cagttaggtt tacagcatga 3540
gcagcagtct ggactacagc atgacccagc caacggctgt ggctgtccaa gctgcggatg 3600
ttgtggctcg tgctctacca attgctgtag ctgcaagcca agctgcaacg gctgctgcgg 3660
cgagcagtgc tgccgctgcg cggactgctt ctcctgctcg tgccctcgta gctccagctg 3720
cttcaacatc ttcaaatgct cctgcgctgg ctgctgctcg agcctgtgca agtgcccctg 3780
cacgacgcag tgcttcagct gccagtcgtc atgctgcaag cggcagcctt cgtgctgcaa 3840
gtgccagtcg tcttgctgcg aggggcagcc ttcctgctgc gagggacact gctgcagcct 3900
cccgaaaccg tcgtgccctg aatgttcctt gtgggtgtgt ctggtcttgc aagaattgta 3960
cagagggttg tcgatgccca cggtgtcgta acccatgctg tctcagtggt tgcttatgtt 4020
gatctagatc cttttttggt tgtcgttttt cttgtatttt ttagttgtta ggcctttgat 4080
taagttcgaa ctttcataaa tatatggtgt ttatcctgta aagaaatgat gatttcaagg 4140
atttttcata gctatgagac gaggttgaac cattgaagag ccaatagacc gtgaagatat 4200
ggagccatac acgctgaata atttttctga cagggtgagg tcgaattggc tgccgtttcg 4260
cgaggacttt tgctgcgcga cggcgaggac agccggggtc ccacctgtca gccagctttg 4320
cgagctcaat gcttttattt ccgccgttgc ttcaccacgc cgcccggcaa attcggcccg 4380
tcaacgacgg taggcctata tctctaatat tgaaatccat gcaaattatc gaacgattag 4440
cggtgccacg tgacatggcg tggttcagca ctcccacact taaaaaggac taaaatataa 4500
aaaacaattt tacgttggag ta 4522
<210> 26
<211> 4073
<212> DNA
<213> 水稻
<400> 26
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgacgctggg tcatgctgta gtccagactg ctgctcatgc 3300
tgtaaaccta actgcagttg ctgcaagacc ccttcttgct gcaaaccgaa ctgctcgtgc 3360
tcctgtccaa gctgcagctc atgctgcgat acatcgtgct gcaaaccgag ctgcacctgc 3420
ttcaacatct tttcatgctt caaatccctg tacaactgct tcaagatccc ttcatgcttc 3480
aagtcccagt gcaactgctc tagccccaat tgctgcactt gcacccatcc aagctgtagc 3540
tgcaagggct gtgcctgtcc aagctgtgga tcaacggctg tggctgtcca agctgcggat 3600
gttgtggctc gtgctctacc aattgctgta gctgcaagcc aagctgcaac ggctgctgcg 3660
gcgagcagtg ctgccgctgc gcggactgct tctcctgctc gtgccctcgt agctccagct 3720
gcttcaacat cttcaaatgc tcctgcgctg gctgctgctc gagcctgtgc aagtgcccct 3780
gcacgacgca gtgcttcagc tgccagtcgt catgctgcaa gcggcagcct tcgtgctgca 3840
agtgccagtc gtcttgctgc gaggggcagc cttcctgctg cgagggacac tgctgcagcc 3900
tcccgaaacc gtcgtgccct gaatgttccc ttgtgggtgt gtctggtctt gcaagaattg 3960
tacagagggt tgtcgatgcc cacggtgtcg taacccatgc tgtctcagtg gttgcttatg 4020
ttgatctaga tccttttttg gttgtcgttt ttcttgtatt ttttagttgt tag 4073
<210> 27
<211> 20
<212> DNA
<213> 水稻
<400> 27
tctttgctgc tgttgcaagt 20
<210> 28
<211> 21
<212> DNA
<213> 水稻
<400> 28
tcaaccactg agacagcatg g 21
<210> 29
<211> 20
<212> DNA
<213> 水稻
<400> 29
ctggaggtgc agatcctgag 20
<210> 30
<211> 21
<212> DNA
<213> 水稻
<400> 30
cttcaatggt tcaacctcgt c 21
<210> 31
<211> 19
<212> DNA
<213> 水稻
<400> 31
ccagcagcgg ctgatcttc 19
<210> 32
<211> 21
<212> DNA
<213> 水稻
<400> 32
caggcgcgca tagcatgaga a 21
<210> 33
<211> 21
<212> DNA
<213> 水稻
<400> 33
atgggctgcc accatggata a 21
<210> 34
<211> 18
<212> DNA
<213> 水稻
<400> 34
cagcttggaa ggccacag 18
<210> 35
<211> 4070
<212> DNA
<213> 水稻
<400> 35
atgggggagg aggcggtggt gatggaggcg ccgaggccca agtcgccgcc gaggtacccg 60
gacctgtgcg gccggcggcg gatgcagctg gaggtgcaga tcctgagccg cgagatcacg 120
ttcctcaagg tgagcgcccc gcggcggcgg cggctgcgtt tttctctata ggtttctctt 180
tcacactcgc tcgctcgaaa ttctcggggc ccgagctcta cttgcttcgt cttcctttga 240
ctttaccgat taattttaaa aaaaaggaga tccgattcgc cgcgcatttt tcaaaaccca 300
agcggccgag tacggagcta cccgctactg caagtaggat gctgtgaagt gtacagtaat 360
ggcgttgtta attgcggtag ctagtgctat tctagtactt gtagtactgt ttctaggcgg 420
aggtgaatca cggcgccatc aatccgaggc tggcgagaca agcttggccc tctttgggcg 480
tggcgccatg gctgtactac ctttgtcgtt gtttggttgg gctcctcgtt ggagaaaaga 540
agagcgtggg catggacaac tgacctgagt ggccttgtca gggagagcca tagcagtgga 600
cgtgtctatc tccgccattg cttcgtcgac actggacgtg cagacggcat ggccatgagg 660
gctttgcacg atgggtggtg ccgtgttggt gttatgggct gccaccatgg tttgaggctt 720
ttgatgttgc tagattttgt gtttaacgag ggagggaaga atgtgttgtt cttgacactg 780
tgctgtgctt ttaaggagca gagatttcag aagctcttca gatatcagag aacttctttg 840
tagtagtaat caaatgcgct ttagacatct ttttatcgtt tcttgcaagg tcagtccctg 900
ctttggtacc cgatctcgct tttgtgcaac atcaaagtta cacttacaca gtaaagcagg 960
aatctttatg ggaccgttcg tactggtcaa ttactccagg ctttgattaa tgggttttaa 1020
gttttaaccg cagatttggt acaagtaaca acctttattt actttttatt tctgcaactg 1080
tgtcttttaa catgaaagaa tccagctcca ttcaaaagtt tagtttttat tttccattgt 1140
ggtgcatggt cactcagcct gcagtactga attatcaaaa ttttcttttg tcatttctct 1200
catgttaagt gcatagtcta ttttacttca acaggtagaa aaacttttgt gggtttgttt 1260
ctagctcaag gaggaaattc atgggtttgc atctagcaca tgagagaata atattggtct 1320
aacacaaagc tccttttgta ggatgagctt cacttccttg aaggagctca gcccgtttct 1380
cgttctggat gcattaaaga gtatgtacta ctgcccttca tgcattacag atattttgtt 1440
tttaagtttt tagaaatttg aagagcttat gtcaagtatg aaatgtcagc ttaattttat 1500
tgctgtcctt atctaatgtc ttatgctctg ttttataaaa tttggttgca ttttctcccc 1560
cagggaaaaa tcttgtataa gtgtgttatg tacttatgtg tataaaatct tgttgcactt 1620
gtatgtcaca cttaggccct gtttagatcc tccaaaatgg caaaagtttt gccattttga 1680
agcacctttt gccattttgg atctaaacac tagtaacaaa acttgacaat ttggcatttg 1740
gcatttgcta gtctatagta gcaaattgtg ccaaaaagtg ctttggaacc actccctctt 1800
tctttctctc tctcacttta gtgctagaat ggcaaaagtt taggatgcat ctaaacacca 1860
actagtactt ttacaatacc aaaacttttg ccatttgcca tttgctattt caaatggata 1920
taaacagggc cttagcaaat caccatatgt taaaattacc ttgggatgaa aaagaaaaag 1980
gaaaccagca ttgaagtctt gtttgaaatg catatgtact tgtaccatta cagaaattct 2040
taaaactgct gtcttgacag ctacttatca aacagcccca cctgcatcat aacgttccta 2100
gtggtgccta taactctgcc tcagttatta ttttgtggcc cactggtcca acaatttgaa 2160
aaaaattata ttgaacagta gtatgacgtc ctctttgctt aagttccata ttacagctca 2220
tagtcctgag atttgtttca ccgattcttt ccatgcgatg tgcacatatt cttattcaat 2280
ttaaaaaatg aaagcagatt atttttaaca agtaacctat cacgttagct taacattgta 2340
tatttgtggt ggaattatgt aatattccga tatcgcattt gaagttttga acatgtgtgc 2400
tcaaattgag ggacacatga ctgtagtgaa agcaaatata aatgtctgaa caatggacta 2460
tactttgtat tcattactac aagttatgtc cttttgcagg ttgctaatgt cctcttacat 2520
tacttgtcag gataaatgag tttgttggta caaaacatga cccactaata ccaacgtatg 2580
gcctctaaac tttcagttcc cccattttaa gcatgttcgc tgtttattta cgagttttga 2640
cattgttttt tccttttcca gaaagagaag gaggcacaga tcttgccgtc tttttcggtg 2700
gatcgggtat gttttgatcc aatatagttt gctcgcaggt tctgaggggc aagaacattc 2760
aaatatctat aatgttttct gttggattca acattcatca ctatttccct cgaaaaaaaa 2820
acattcgtca ctattggaat tgaaagtctg aaagtgcctc tagtcccttt gtatgttaaa 2880
agtcaataaa caagcagtag ttttctatat gccacattaa tattattgac gcattttaaa 2940
aagcaaacta gtccagggat gtaatcatct ttgttatcta aaactaaaaa aggaaaaact 3000
agtgcttttt tacattaaca ttgatttttt tgcggctgaa attacatgta gaaactttgg 3060
cataataatc tgtactactg ccaaactgag cttttacatg gtgaaaatat tttccctgca 3120
gatcaaaatt gtgtatctgc atttcatgtc tttgctgctg ttgcaagtgc tcacccaagt 3180
gcaaaagacc aaggtgcctc aattgttctt gcagctcatg ctgcgacgag ccatgctgta 3240
agccaaactg cagtgcgtgc tgggaacatt cagggcacga cggtttcggg aggctgcagc 3300
agtgtccctc gcagcaggaa ggctgcccct cgcagcaaga cgactggcac ttgcagcacg 3360
aaggctgccg cttgcagcat gacgactggc agctgaagca ctgcgtcgtg caggggcact 3420
tgcacaggct cgagcagcag ccagcgcagg agcatttgaa gatgttgaag cagctggagc 3480
tacgagggca cgagcaggag aagcagtccg cgcagcggca gcactgctcg ccgcagcagc 3540
cgttgcagct tggcttgcag ctacagcaat tggtagagca cgagccacaa catccgcagc 3600
ttggacagcc acagccgttg atccacagct tggacaggca cagcccttgc agctacagct 3660
tggatgggtg caagtgcagc aattggggct agagcagttg cactgggact tgaagcatga 3720
agggatcttg aagcagttgt acagggattt gaagcatgaa aagatgttga agcaggtgca 3780
gctcggtttg cagcacgatg tatcgcagca tgagctgcag cttggacagg agcacgagca 3840
gttcggtttg cagcaagaag gggtcttgca gcaactgcag ttaggtttac agcatgagca 3900
gcagtctgga ctacagcatg acccagcgtg tgggtgtgtc tggtcttgca agaattgtac 3960
agagggttgt cgatgcccac ggtgtcgtaa cccatgctgt ctcagtggtt gcttatgttg 4020
atctagatcc ttttttggtt gtcgtttttc ttgtattttt tagttgttag 4070

Claims (18)

1.一种降低靶基因的表达的方法,所述方法包括以下:
a)将能够在靶基因组位点定点DNA切割的核酸酶引入细胞;
b)在单个靶基因内进行两个或更多个双链切割;
c)选择其中双链切割已被修复且中间DNA反向的细胞;
d)降低该靶基因的表达。
2.如权利要求1所述的方法,其中所述核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
3.如权利要求1所述的方法,其中所述靶基因中的双链切割位于启动子、UTR、外显子、内含子或基因-基因连接区。
4.如权利要求1所述的方法,其中如权利要求1所述的细胞具有单倍体、二倍体、多倍体或六倍体基因组。
5.如权利要求1所述的方法,其中所述靶基因为隐性或半显性。
6.如权利要求1所述的方法,所述方法进一步包括一个或多个指导序列。
7.如权利要求6所述的方法,其中所述一个或多个指导序列包含两个或更多个指导序列。
8.如权利要求1所述的方法,其中所述细胞是植物细胞。
9.一种通过基因组编辑来重排染色体的方法,所述方法包括:
a.通过定点核酸酶在染色体中产生至少一个断裂;
b.选择具有重排的染色体。
10.如权利要求9所述的方法,其中所述定点核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9-FokI、dCpf1-FokI、嵌合Cas9/Cpf1-胞嘧啶脱氨酶、嵌合Cas9/Cpf1-腺嘌呤脱氨酶、嵌合FEN1-FokI、和Mega-TAL、切口酶Cas9(nCas9)、嵌合dCas9非FokI核酸酶和dCpf1非FokI核酸酶。
11.如权利要求9所述的方法,其中所述染色体重排包括缺失、复制、倒位或易位。
12.如权利要求9所述的方法,其中所述染色体重排引起基因表达的修饰。
13.如权利要求9所述的方法,其中所述基因表达修饰包括在前体mRNA水平、或在成熟mRNA水平或在翻译水平上的调节。
14.如权利要求9所述的方法,其中当所述染色体可归入一个核中,例如在种间杂种中时,所述染色体重排包括来自两个物种的染色体。
15.如权利要求9所述的方法,其中所述染色体重排经由将至少两个等位基因或来自不同等位基因的两个成分融合而导致新的等位基因产生。
16.如权利要求11所述的方法,其中所述染色体重排靶向启动子、外显子、内含子或转录终止子。
17.如权利要求12所述的方法,所述染色体重排导致与重排的基因具有序列相似性的不同基因的基因表达的修饰。
18.如权利要求11所述的方法,其中所述缺失、重复、倒位或易位不少于19个碱基对。
CN201980080395.1A 2018-12-04 2019-11-26 经由基因组编辑进行基因沉默 Pending CN113473845A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2018119155 2018-12-04
CNPCT/CN2018/119155 2018-12-04
PCT/US2019/063200 WO2020117553A1 (en) 2018-12-04 2019-11-26 Gene silencing via genome editing

Publications (1)

Publication Number Publication Date
CN113473845A true CN113473845A (zh) 2021-10-01

Family

ID=70973530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980080395.1A Pending CN113473845A (zh) 2018-12-04 2019-11-26 经由基因组编辑进行基因沉默

Country Status (9)

Country Link
US (1) US20220010322A1 (zh)
EP (1) EP3890473A4 (zh)
JP (1) JP2022511508A (zh)
KR (1) KR20210099608A (zh)
CN (1) CN113473845A (zh)
AU (1) AU2019392277A1 (zh)
BR (1) BR112021010781A2 (zh)
PH (1) PH12021551204A1 (zh)
WO (1) WO2020117553A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114008203A (zh) * 2019-05-29 2022-02-01 孟山都技术公司 使用基因组编辑产生显性等位基因的方法和组合物

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021017159A2 (pt) * 2019-03-01 2021-11-23 Syngenta Crop Protection Ag Supressão da expressão de gene alvo através da edição de genoma de mirnas nativos
MX2021014229A (es) 2019-05-29 2022-01-06 Monsanto Technology Llc Metodos y composiciones para generar alelos dominantes de baja estatura utilizando edicion genomica.
EP4288551A1 (en) 2021-02-02 2023-12-13 Limagrain Europe Linkage of a distal promoter to a gene of interest by gene editing to modify gene expression
CN112941051A (zh) * 2021-04-14 2021-06-11 浙江优诺生物科技有限公司 Fenm蛋白突变体及其应用和含该突变体的试剂盒
WO2023049926A2 (en) * 2021-09-27 2023-03-30 Vor Biopharma Inc. Fusion polypeptides for genetic editing and methods of use thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024047A1 (en) * 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
CN107043779A (zh) * 2016-12-01 2017-08-15 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
WO2018119225A1 (en) * 2016-12-22 2018-06-28 Monsanto Technology Llc Genome editing-based crop engineering and production of brachytic plants

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010143917A2 (en) * 2009-06-11 2010-12-16 Toolgen Incorporation Targeted genomic rearrangements using site-specific nucleases
WO2013068845A2 (en) * 2011-11-07 2013-05-16 The University Of Western Ontario Endonuclease for genome editing
EP2970997A1 (en) * 2013-03-15 2016-01-20 Regents of the University of Minnesota Engineering plant genomes using crispr/cas systems
US11773400B2 (en) * 2013-08-22 2023-10-03 E.I. Du Pont De Nemours And Company Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
US10308947B2 (en) * 2014-10-17 2019-06-04 The Penn State Research Foundation Methods and compositions for multiplex RNA guided genome editing and other RNA technologies
MA41382A (fr) * 2015-03-20 2017-11-28 Univ Temple Édition génique basée sur le système crispr/endonucléase à induction par tat
BR112019020342A2 (pt) * 2017-04-03 2020-04-28 Monsanto Technology Llc composições e métodos para transferir componentes ou traços citoplasmáticos ou nucleares
CA3069542A1 (en) * 2017-08-04 2019-02-07 Syngenta Participations Ag Methods and compositions for targeted genomic insertion
EP3752622A4 (en) * 2018-02-15 2021-11-03 Monsanto Technology LLC METHODS AND COMPOSITIONS TO INCREASE HARVEST YIELD BY EDITING GA20 OXIDASE GENES TO GROW PLANTS WITH SHORT STATUS
BR112020018646A2 (pt) * 2018-03-12 2020-12-29 Pioneer Hi-Bred International, Inc. Métodos para transformação de planta

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024047A1 (en) * 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
CN107043779A (zh) * 2016-12-01 2017-08-15 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
WO2018119225A1 (en) * 2016-12-22 2018-06-28 Monsanto Technology Llc Genome editing-based crop engineering and production of brachytic plants

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114008203A (zh) * 2019-05-29 2022-02-01 孟山都技术公司 使用基因组编辑产生显性等位基因的方法和组合物

Also Published As

Publication number Publication date
JP2022511508A (ja) 2022-01-31
EP3890473A1 (en) 2021-10-13
WO2020117553A1 (en) 2020-06-11
KR20210099608A (ko) 2021-08-12
US20220010322A1 (en) 2022-01-13
BR112021010781A2 (pt) 2021-11-03
AU2019392277A1 (en) 2021-06-24
EP3890473A4 (en) 2022-09-07
PH12021551204A1 (en) 2021-10-25

Similar Documents

Publication Publication Date Title
CN107109427B (zh) 用于鉴定和富集包含位点特异性基因组修饰的细胞的方法和组合物
KR102450868B1 (ko) 올리고뉴클레오타이드 매개 유전자 보수를 사용한 표적화된 유전자 변형의 효율을 증가시키기 위한 방법 및 조성물
CN113473845A (zh) 经由基因组编辑进行基因沉默
AU2018309648B2 (en) Methods and compositions for targeted genomic insertion
US20220403396A1 (en) Methods and compositions for dna base editing
JP7545985B2 (ja) 天然miRNAのゲノム編集による標的遺伝子発現の抑制
US11459577B2 (en) Targeted insertion sites in the maize genome
US20230114951A1 (en) Targeted insertion sites in the maize genome
US20210054367A1 (en) Methods and compositions for targeted editing of polynucleotides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination