CN112251419B - 一种在生物体内产生新突变的方法及应用 - Google Patents

一种在生物体内产生新突变的方法及应用 Download PDF

Info

Publication number
CN112251419B
CN112251419B CN202011089074.9A CN202011089074A CN112251419B CN 112251419 B CN112251419 B CN 112251419B CN 202011089074 A CN202011089074 A CN 202011089074A CN 112251419 B CN112251419 B CN 112251419B
Authority
CN
China
Prior art keywords
ala
leu
gly
val
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011089074.9A
Other languages
English (en)
Other versions
CN112251419A (zh
Inventor
姜临建
莫苏东
王继尧
李玉才
戚伟
李华荣
陈波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Kingagroot Chemical Compound Co Ltd
Original Assignee
Qingdao Kingagroot Chemical Compound Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Kingagroot Chemical Compound Co Ltd filed Critical Qingdao Kingagroot Chemical Compound Co Ltd
Publication of CN112251419A publication Critical patent/CN112251419A/zh
Application granted granted Critical
Publication of CN112251419B publication Critical patent/CN112251419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8277Phosphinotricin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8278Sulfonylurea
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01006Acetolactate synthase (2.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y604/00Ligases forming carbon-carbon bonds (6.4)
    • C12Y604/01Ligases forming carbon-carbon bonds (6.4.1)
    • C12Y604/01002Acetyl-CoA carboxylase (6.4.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明属于基因工程技术领域,具体而言涉及一种在无人工DNA模板的前提下,在生物体内创制定点突变的方法及应用。所述方法包括以下步骤:在生物体基因组的特定位置上按先后顺序依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生。本发明根据顺次编辑产生的新的修复事件形成的序列,设计新靶点,可以在基因组的特定位置连续多次形成突变,极大的丰富DNA断裂后修复事件的类型,实现单次基因编辑无法得到的新的碱基替换、删除及插入突变。

Description

一种在生物体内产生新突变的方法及应用
优先权信息
本申请要求2019年11月7日提交的中国发明专利申请201911081617.X、2020年8月15日提交的中国发明专利申请202010821877.2和2020年9月16日提交的中国发明专利申请202010974151.2的权益,上述申请通过引用完全并入本文。
技术领域
本发明属于基因工程技术领域,具体而言涉及一种在无人工DNA模板的前提下,在生物体内创制定点突变的方法及应用。
背景技术
利用基因工程技术改造生物体基因组已在工农业生产中得到广泛应用,例如在制药、化工领域常用的转基因微生物和农业领域的抗虫抗除草剂转基因作物等。随着位点特异性核酸酶的出现,通过将靶向断裂引入到受体生物基因组并引起自发修复,已经能够实现基因组的定点编辑,对基因组进行更精确的改造。
基因编辑工具主要包括三大类型序列特异性核酸酶(SSN):锌指核酸酶(Zincfinger nuclease,ZFN)、类转录激活因子效应物核酸酶(Transcription activator-likeeffector nuclease,TALEN)和成簇的规律间隔的短回文重复序列(CRISPR)–Cas系统(Clustered regularly interspaced short palindromic repeats/CRISPR associated,CRISPR/Cas system)。序列特异性核酸酶是可编程的核酸酶,能够在基因组中的特定位点产生DNA双链断裂(DSBs)。DNA双链断裂激活内源性DNA修复途径修复细胞DNA损伤,修复过程中容易导致目标位点DNA序列的变化,从而实现在预期位点引入突变,这项技术使生物学家能够精确靶向目标基因并且加以编辑。其中ZFN和TALEN都需要针对靶点序列设计特异识别的蛋白模块,通量低,操作复杂。而CRISPR/Cas系统中Cas蛋白是通用的,针对靶点设计特异的CRISPR-RNA(crRNA)即可单独或与反式激活RNA(tracrRNA)配合形成引导RNA(guideRNA,gRNA),或设计单一引导RNA(single guide RNA,sgRNA)即可,crRNA与tracrRNA共同或者sgRNA单独和Cas蛋白组装形成核糖核蛋白复合体(ribonucleoprotein,RNP),在基因组中以原间隔序列毗邻基序(protospacer adjacent motif,PAM)为基础识别靶点序列,实现定点编辑,因其操作简便、适用范围广、通量高成为目前主流的基因编辑工具。
序列特异性核酸酶能够在基因组的特定位置产生DNA双链断裂,这些DNA双链断裂会被修复成多种不同的修复类型,其中以碱基的插入或缺失为主。如CRISPR/Cas9编辑事件中最为普遍的两种类型是在断口处插入一个碱基或在断口处删除一个碱基(Shen etal.2018.Predictable and precise template-free CRISPR editing of pathogenicvariants.Nature.DOI:10.1038/s41586-018-0686-x)。编码区碱基的插入、缺失会造成移码突变,导致基因功能的丧失,因此,上述基因编辑工具最主要的用途仍然是用于基因敲除。
一直以来单独使用序列特异性核酸酶被认为无法实现碱基替换类型的突变。为此,现有技术提出了3种解决方案:1)加入外源DNA片段作为修复模板引发同源重组修复途径;2)将脱氨酶与Cas9融合开发先后出了C到T,A到G的单碱基编辑工具;3)将逆转录酶与Cas9融合,以pegRNA引导合成置换小范围的DNA链。但是这三种方案的编辑效率都显著低于基因敲除的效率,同时引入的外源DNA片段和逆转录酶也容易引起生物安全性的顾虑,单碱基编辑的脱靶效应也制约了其在细胞治疗中的应用潜力。尤其对于长周期的植物育种项目而言,如何提高目标位点的碱基替换效率同时降低监管部门对于生物安全性的顾虑是基因编辑技术应用中需要解决的问题。
综上所述,仅用序列特异性核酸酶的靶向敲除实现定点的碱基替换,不引入外源DNA片段,特别是通过非转基因的瞬时编辑体系高效率的完成定点的碱基替换编辑在细胞治疗和生物育种领域都有着急迫的技术需求。
发明简述
本发明提供了一种仅通过在基因组上产生双链断裂的形式,并且在不提供人工DNA模板的情况下,在生物体内创制定点突变的方法及其应用。
本发明采用的技术方案如下:
一种在生物体内产生新突变的方法,包括以下步骤:在生物体基因组的特定位置上按先后顺序依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生。
在一具体实施方式中,所述的“DNA断裂”是通过将具有靶向特性的核酸酶递送到生物体细胞内与基因组DNA特定位置接触实现的。
在一具体实施方式中,所述的“具有靶向特性的核酸酶”为ZFN、TALEN或CRISPR/Cas系统。
在一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由ZFN或TALEN编辑产生的在先的DNA断裂修复事件形成的新序列设计新的ZFN或TALEN蛋白,对该位点再次进行切割。
在另一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割。例如,第二次是针对由Cas9编辑的第一次断裂修复事件形成的新序列设计新的靶向RNA,对该处再次进行切断。同理,可以根据再次修复事件形成的新序列设计新的靶向RNA,对该处进行第三次切断。如图1所示,以此类推。
在一具体实施方式中,所述“两个以上的DNA断裂”是将不同的靶向核酸酶按先后顺序递送到不同代的受体细胞中产生的,以完成在先编辑的突变细胞作为受体接受在后编辑的靶向核酸酶的递送,进行二次编辑产生定点突变。这种方式优选用于ZFN、TALEN编辑系统。
在另一具体实施方式中,所述“两个以上的DNA断裂”是将不同靶向的靶向核酸酶递送到同一个受体细胞中产生的。这种方式优选用于CRISPR/Cas编辑系统。
在一具体实施方式中,所述“两个以上的DNA断裂”由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
在另一具体实施方式中,所述“两个以上的DNA断裂”由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。例如来自化脓链球菌(Streptococcus pyogenes)的Cas9识别的PAM序列是“NGG”或“NAG”(Jinek等,“Aprogrammable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity”,Science 2012,337:816-821),金黄色葡萄球菌(Staphylococcus aureus)的Cas9识别的PAM序列是“NNGRRT”或“NNGRR(N)”,脑膜炎奈瑟球菌(Neisseria meningitidis)Cas9识别PAM序列NNNNGATT,嗜热链球菌(Streptococcusthermophilus)Cas9识别PAM序列NNAGAAW。在这种方式下,DNA分子上可编辑的窗口范围更大。
在一具体实施方式中,所述靶向核酸酶为所有能实现基因组编辑的CRISPR/Cas核酸酶。
在一具体实施方式中,所述靶向核酸酶以DNA形式存在。
在另一具体实施方式中,所述靶向核酸酶以mRNA或蛋白形式存在,而非DNA形式。优选蛋白形式。
在一具体实施方式中,将靶向核酸酶递送到细胞内的方法包括,1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;5)基因枪轰击;6)农杆菌介导的转化方法等。
所述方法以在先的DNA断裂修复后产生的新序列为基础设计新靶点,可以在基因组的特定位置连续多次形成突变,指数级的丰富DNA断裂后修复事件的类型,实现单次基因编辑无法得到的新的碱基替换、删除及插入突变类型,适合用作创造新突变的工具,本方法可以简述为循环打靶或连续打靶的方法。
在一具体实施方式中,根据对生物体基因组特定位置在先断裂修复后预测可能产生的特定新序列设计新靶点,进行顺次编辑,可以提前设计该位置最终可能产生的突变,实现预期编辑。
在另一具体实施方式中,根据对生物体基因组特定位置在先断裂修复后预测可能产生的新序列设计新靶点,进行顺次编辑,除预期的编辑事件外,该位置最终还可能产生多种不同突变,可作为创造多种不同突变的工具。
在另一方面,本发明还提供了一种在生物体内产生新突变的方法,包括以下步骤:在生物体基因组或染色体水平上,通过在基因的特定位置上按先后顺序依次产生两个以上的DNA断裂,实现精准碱基替换、删除或插入。
在一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对前一次断裂修复事件形成的新序列设计新的靶向RNA,对该处再次进行切断。
在一具体实施方式中,所述的“DNA断裂”是通过具有靶向特性的核酸酶来实现。
本发明还提供一种采用前述方法获得的新突变。
本发明另外提供一种具有所述新突变的蛋白或其生物活性片段。
本发明另外提供一种核酸,其包含编码所述蛋白或其生物活性片段的核酸序列或者其互补序列。
本发明另外还提供一种核酸,其包含:
(a)编码靶向RNA的核苷酸序列,其中,
所述RNA至少包含两个,前一个RNA靶向DNA导致其断裂,后一个靶向RNA针对前一次断裂修复事件形成的序列再次进行切断。
在一具体实施方式中,所述核酸还包括(b)编码Cas多肽的核苷酸序列。
在一具体实施方式中,所述靶向RNA为sgRNA或gRNA。
在一具体实施方式中,所述Cas多肽和所述靶向RNA为在体外细胞或离体细胞内。
本发明另外提供一种重组表达载体,其包含前述的核酸,以及与之可操作地连接的启动子。
本发明另外提供一种表达盒,其中包含前述的核酸。
本发明另外提供一种宿主细胞,其中包含有所述的表达盒。
本发明另外还提供采用所述宿主细胞再生成的生物。
本发明还提供一种裂解靶DNA的方法,其包括使所述靶DNA与复合物接触,所述复合物包含:
(a)Cas多肽;以及
(b)至少两个靶向RNA,前一个RNA靶向DNA导致其断裂,后一个靶向RNA针对前一次断裂修复事件形成的序列再次进行切断。
在一具体实施方式中,所述靶向RNA为sgRNA或gRNA。
在一具体实施方式中,所述靶DNA存在于细菌细胞、真核细胞、植物细胞或动物细胞中。
在一具体实施方式中,所述靶DNA为染色体DNA。
在一具体实施方式中,所述Cas多肽和所述靶向RNA为在体外细胞或离体细胞内。
在一具体实施方式中,所述接触包括将以下引入细胞:(a)所述Cas多肽或编码所述Cas多肽的多核苷酸,和(b)所述靶向RNA或编码所述靶向RNA的DNA多核苷酸。
本发明还提供一种组合物,其包含:
(a)Cas多肽,或编码所述Cas多肽的多核苷酸;以及
(b)至少两个靶向RNA,或编码所述靶向RNA的DNA多核苷酸,其中,前一个RNA靶向DNA导致其断裂,后一个靶向RNA针对前一次断裂修复事件形成的序列再次进行切断。
在一具体实施方式中,所述靶向RNA为sgRNA或gRNA。
在一具体实施方式中,所述Cas多肽和所述靶向RNA为在体外细胞或离体细胞内。
本发明还提供所述的组合物在用于制备治疗疾病的药剂中的用途。
能够用本发明的组合物进行治疗的疾病包括,但不限于,遗传性酪氨酸血症1型、苯丙酮尿症、早衰症、镰状细胞病等单基因突变引起的疾病,通过向细胞内递送Cas蛋白和针对致病突变位点预期可修复为正常功能蛋白的crRNA或sgRNA组合物,诱导细胞自发修复产生治疗效果。
本发明还提供一种试剂盒,其包含:
(a)Cas多肽,或包含编码所述Cas多肽的核苷酸序列的核酸;以及
(b)至少两个靶向RNA,或包含编码所述靶向RNA的核苷酸序列的核酸,其中,前一个RNA靶向DNA导致其断裂,后一个靶向RNA针对前一次断裂修复事件形成的序列再次进行切断;
其中(a)和(b)是在相同或单独的容器中。
在一具体实施方式中,所述靶向RNA为sgRNA或gRNA。
在一具体实施方式中,(b)中的靶向RNA是在相同或单独的容器中。
本发明还提供一种不依赖外源转基因标记筛选编辑事件的方法,包括以下步骤:
1)在受体细胞第一目标基因的特定位置上按先后顺序依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2)第一目标基因特定位置经顺次切割并修复后产生的某些编辑事件,能够赋予突变体细胞对某种筛选压力的抗性,产生表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的生物;
3)可选的,在第一目标基因之外,同时使用针对至少一个第二目标基因的靶向核酸酶对其它靶点进行编辑,通过筛选第一目标基因突变产生的可选择性状同步对第二目标基因的编辑事件进行富集筛选,分离出同时含有第一目标基因与至少一个第二目标基因编辑事件的细胞、组织、器官或完整的生物。
在一具体实施方式中,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失。
在一具体实施方式中,所述“某种筛选压力”可以是环境压力,如高温、低温、低氧等,也可以是添加的化合物压力,例如盐离子浓度、抗生素、细胞毒素、除草剂等。
在一具体实施方式中,所述的“DNA断裂”是通过将具有靶向特性的核酸酶递送到生物体细胞内与基因组DNA特定位置接触实现的。
在一具体实施方式中,所述的“具有靶向特性的核酸酶”为所有能实现基因组编辑的CRISPR/Cas核酸酶。
在一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割。
在一具体实施方式中,所述“两个以上的DNA断裂”由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
在另一具体实施方式中,所述“两个以上的DNA断裂”由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。在这种方式下,DNA分子上可编辑的窗口范围更大。
在一具体实施方式中,所述“第二目标基因”是指编码与第一目标基因不同的其它基因。
在一具体实施方式中,所述“针对至少一个第二目标基因的靶向核酸酶”与在第一目标基因特定位置上产生DNA断裂使用的CRISPR/Cas核酸酶相同。
在另一具体实施方式中,所述“针对至少一个第二目标基因的靶向核酸酶”与在第一目标基因特定位置上产生DNA断裂使用的CRISPR/Cas核酸酶不同。在这种方式下,第二目标基因上可选择的编辑位点更多。
在一具体实施方式中,所述靶向核酸酶以DNA形式存在。
在另一具体实施方式中,所述靶向核酸酶以mRNA或蛋白形式存在,而非DNA形式。优选蛋白形式。
在一具体实施方式中,将靶向核酸酶递送到细胞内的方法包括,1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;5)基因枪轰击;6)农杆菌介导的转化方法等。
本发明进一步提供了一种对生物体基因组进行非转基因瞬时编辑的方法,包括以下步骤:
1)针对受体细胞第一目标基因的特定位置设计并合成至少两条crRNA片段组合或至少两条sgRNA片段组合,所述crRNA组合与tracrRNA结合或单独使用sgRNA组合能够引导对应的Cas蛋白在受体细胞第一目标基因的特定位置上依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2)将适量CRISPR/Cas蛋白或其相应的mRNA与上述预先设计合成的能够引导第一目标基因定点编辑产生内源筛选标记的crRNA片段组合和tracrRNA片段或单独sgRNA片段组合混合,可选的,进一步加入至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段,在体外孵育形成RNP复合体;
3)将上述RNP复合体递送到受体细胞中,与基因组DNA特定位置接触实现基因编辑;
4)根据RNP复合体对第一目标基因的定点编辑产生的表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的生物,以及可选的,分离出同时含有第一目标基因与至少一个第二、第三或更多目标基因的编辑事件的细胞、组织、器官或完整的生物。
在一具体实施方式中,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失
在一具体实施方式中,所述“某种筛选压力”可以是环境压力,如高温、低温、低氧等,也可以是添加的化合物压力,例如盐离子浓度、抗生素、细胞毒素、除草剂等。
在一具体实施方式中,所述的CRISPR/Cas蛋白为所有能实现基因组编辑的CRISPR/Cas核酸酶。
在一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割。
在一具体实施方式中,所述“两个以上的DNA断裂”由同一种CRISPR/Cas蛋白与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
在另一具体实施方式中,所述“两个以上的DNA断裂”由两种以上识别不同PAM序列的CRISPR/Cas蛋白与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。在这种方式下,DNA分子上可编辑的窗口范围更大。
在一具体实施方式中,所述“第二、第三或更多目标基因”是指编码与第一目标基因不同的其它基因。
在一具体实施方式中,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA共用同一种Cas蛋白。
在另一具体实施方式中,所述所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA使用识别不同PAM序列的Cas蛋白。在这种方式下,第二目标基因上可选择的编辑位点更多。
在一具体实施方式中,将所述RNP复合体递送到细胞内的方法包括,1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;5)基因枪轰击等。
本发明还提供一种对植物基因组进行非转基因瞬时编辑的方法,包括以下步骤:
1)针对受体植物细胞或组织第一目标基因的特定位置设计并合成至少两条crRNA片段组合或至少两条sgRNA片段组合,所述crRNA组合与tracrRNA结合或单独使用sgRNA组合能够引导对应的Cas蛋白在受体细胞第一目标基因的特定位置上依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2)将适量CRISPR/Cas蛋白或其相应的mRNA与上述预先设计合成的能够引导第一目标基因定点编辑产生内源筛选标记的crRNA片段组合和tracrRNA片段或单独sgRNA片段组合混合,可选的,进一步加入至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段,在体外孵育形成RNP复合体;
3)将上述RNP复合体递送到受体植物细胞或组织中,与基因组DNA特定位置接触实现基因编辑;
4)根据RNP复合体对第一目标基因的定点编辑产生的表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的植物,以及可选的,分离出同时含有第一目标基因与至少一个第二、第三或更多目标基因的编辑事件的细胞、组织、器官或完整的植物。
在一具体实施方式中,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
在一具体实施方式中,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失。
在一具体实施方式中,所述“某种筛选压力”可以是环境压力,如高温、低温、低氧等,也可以是添加的化合物压力,例如盐离子浓度、抗生素、细胞毒素、除草剂等。
在一具体实施方式中,所述“受体植物细胞或组织”为任何能作为瞬时表达受体并能经过组织培养再生为完整植株的细胞或组织。具体而言,所述细胞具体为原生质体细胞或悬浮细胞等;所述组织具体为愈伤组织、幼胚、成熟胚、叶片、茎尖、幼穗或下胚轴等。
在一具体实施方式中,所述的CRISPR/Cas蛋白为所有能实现基因组编辑的CRISPR/Cas核酸酶。
在一具体实施方式中,所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割。
在一具体实施方式中,所述“两个以上的DNA断裂”由同一种CRISPR/Cas蛋白与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
在另一具体实施方式中,所述“两个以上的DNA断裂”由两种以上识别不同PAM序列的CRISPR/Cas蛋白与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。在这种方式下,DNA分子上可编辑的窗口范围更大。
在一具体实施方式中,所述“第二、第三或更多目标基因”是指编码与第一目标基因不同的其它基因。
在一具体实施方式中,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA共用同一种Cas蛋白。
在另一具体实施方式中,所述所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA使用识别不同PAM序列的Cas蛋白。在这种方式下,第二目标基因上可选择的编辑位点更多。
在一具体实施方式中,将所述RNP复合体递送到植物细胞内的方法包括,1)PEG介导的原生质体转化的方法;2)显微注射;3)基因枪轰击;4)碳化硅纤维介导法;5)真空渗入法或其他任何瞬时导入方法。优选基因枪轰击。
在一具体实施方式中,所述“第一目标基因”是编码选自除草剂抗性/耐受性的至少一种表型可选择性状的至少一个内源基因,其中除草剂抗性/耐受性选自包括对EPSPS抑制剂(包括草甘膦)的抗性/耐受性;对谷氨酰胺合成抑制剂(包括草铵膦)的抗性/耐受性;对ALS或AHAS抑制剂(包括咪唑啉或磺酰脲)的抗性/耐受性;对ACCase抑制剂(包括芳氧基苯氧基丙酸(FOP))的抗性/耐受性;对类胡萝卜素生物合成抑制剂的抗性/耐受性,包括八氢番茄红素去饱和酶(PDS)步骤的类胡萝卜素生物合成抑制剂、4-羟基苯基丙酮酸双加氧酶(HPPD)抑制剂或其他类胡萝卜素生物合成靶抑制剂;对纤维素抑制剂的抗性/耐受性;对脂质合成抑制剂的抗性/耐受性;对长链脂肪酸抑制剂的抗性/耐受性;对微管组装抑制剂的抗性/耐受性;对光系统I电子分流剂的抗性/耐受性;对光系统II抑制剂(包括氨基甲酸酯、三嗪类和三嗪酮类)的抗性/耐受性;对PPO抑制剂的抗性/耐受性和对合成生长素(包括麦草畏、2,4-D(即2,4-二氯苯氧乙酸))的抗性/耐受性。其中,所述第一目标基因可选自PsbA、ALS、EPSPS、ACCase、PPO、HPPD、PDS、GS、DOXPS、TIR1、AFB5,这些除草剂靶标基因的特定位置经顺次切割并修复后产生的某些突变类型能够赋予所述受体植物细胞对相应除草剂的抗性/耐受性。
在一具体实施方式中,所述“第一目标基因”为ALS,所述“基因的特定位置”是指拟南芥AtALS蛋白氨基酸序列(如SEQ ID NO:1所示)位点A122、P197、R198、D204、A205、D376、R377、W574、S653、G654,以及以AtALS氨基酸序列为参照标准的其它植物的ALS蛋白相对应的上述氨基酸位点。所述crRNA或sgRNA靶向包含选自编码AtALS蛋白氨基酸序列位点A122、P197、R198、D204、A205、D376、R377、W574、S653、G654或其任意组合的序列的靶序列,以及以AtALS氨基酸序列为参照标准的其它植物的ALS蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。优选ALS W574位点。所述筛选压力优选啶磺草胺或烟嘧磺隆处理。
在一具体实施方式中,所述“第一目标基因”为ACCase,所述“基因的特定位置”是指大穗看麦娘(Alopecurus myosuroides)AmACCase蛋白氨基酸序列(如SEQ ID NO:3所示,基因序列如SEQ ID NO:4所示)位点I1781、E1874、N1878、W1999、W2027、I2041、D2078、C2088、G2096,以及以AmACCase氨基酸序列为参照标准的其它单子叶植物的ACCase蛋白相对应的上述氨基酸位点。所述crRNA或sgRNA靶向包含选自编码AmACCase基因氨基酸序列位点I1781、E1874、N1878、W1999、W2027、I2041、D2078、C2088、G2096或其任意组合的序列的靶序列,以及以AmACCase氨基酸序列为参照标准的其它单子叶植物的ACCase蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。优选ACCase W2027位点。所述筛选压力优选精喹禾灵处理。
在一具体实施方式中,所述“第一目标基因”为HPPD,所述“基因的特定位置”是指水稻OsHPPD蛋白氨基酸序列(如SEQ ID NO:5所示,基因组序列如SEQ ID NO:6所示)位点H141、L276、P277、N338、G342、R346、D370、P386、K418、G419,以及以OsHPPD氨基酸序列为参照标准的其它植物的HPPD蛋白相对应的上述氨基酸位点。所述crRNA或sgRNA靶向包含选自编码OsHPPD基因氨基酸序列位点H141、L276、P277、N338、G342、R346、D370、P386、K418、G419或其任意组合的序列的靶序列,以及以OsHPPD氨基酸序列为参照标准的其它植物的HPPD蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。所述筛选压力优选双唑草酮处理。
在一具体实施方式中,所述“第一目标基因”为PPO,所述“基因的特定位置”是指水稻OsPPO1蛋白氨基酸序列(如SEQ ID NO:7所示,基因组序列如SEQ ID NO:8所示)位点S128、V217、S223、V364、K373、L423、Y425、W470,以及以OsPPO1氨基酸序列为参照标准的其它植物的PPO蛋白相对应的上述氨基酸位点。所述crRNA或sgRNA靶向包含选自编码OsPPO1基因氨基酸序列位点S128、V217、S223、V364、K373、L423、Y425、W470或其任意组合的序列的靶序列,以及以OsPPO1氨基酸序列为参照标准的其它植物的PPO蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。所述筛选压力优选苯嘧磺草胺处理。
在一具体实施方式中,所述“第一目标基因”为TIR1,所述“基因的特定位置”是指水稻OsTIR1蛋白氨基酸序列(如SEQ ID NO:9所示,基因组序列如SEQ ID NO:10所示)位点F93、F357、C413、S448,以及以OsTIR1氨基酸序列为参照标准的其它植物的TIR1蛋白相对应的上述氨基酸位点。所述crRNA或sgRNA靶向包含选自编码OsTIR1基因氨基酸序列位点F93、F357、C413、S448或其任意组合的序列的靶序列,以及以OsTIR1氨基酸序列为参照标准的其它植物的TIR1蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。所述筛选压力优选2,4-D处理。
本发明还提供了采用前述方法的非转基因瞬时编辑系统。
本发明另外提供了前述非转基因瞬时编辑系统作为筛选标记的用途。
本发明另外提供了前述非转基因瞬时编辑系统在疾病治疗中的用途。
本发明另外提供了前述非转基因瞬时编辑系统在生物育种中的用途。
本发明另外提供了一种采用前述方法获得的遗传修饰植物,其基因组中包含第一目标基因的编辑事件,所述遗传修饰植物是非转基因方式获得的。
本发明另外提供了一种采用前述方法获得的遗传修饰植物,其基因组中包含第一目标基因的编辑事件,还包括至少一个第二目标基因的编辑事件,所述遗传修饰植物是非转基因方式获得的。
本发明另外提供了一种采用前述方法获得的遗传修饰植物,其基因组中包含至少一个第二靶点基因的编辑事件,所述遗传修饰植物是非转基因方式获得的,其中第一目标基因的编辑事件已经过遗传分离去除。
本发明还提供了采用前述方法获得的遗传修饰植物的基因组,所述基因组包含:1)第一目标基因的编辑事件;2)第一目标基因的编辑事件和至少一个第二目标基因的编辑事件;或3)至少一个第二靶点基因的编辑事件,其中第一目标基因的编辑事件已经过遗传分离去除;其中所述遗传修饰植物是非转基因方式获得的。
本发明另一方面提供了一种采用前述方法获得的植物基因新突变。
本发明还提供一种在植物内产生的新突变,其包括以下类型中的一个或两个以上的组合:
对应于拟南芥ALS376位置处的天冬氨酸被任何其他氨基酸取代、ALS574位置处的色氨酸被任何其他氨基酸取代、ALS653位置处的丝氨酸被任何其他氨基酸取代、或ALS654位置处的丝氨酸被任何其他氨基酸取代;或者,对应于大穗看麦娘ACCase2027位置处的色氨酸被任何其他氨基酸取代。
在一具体实施方式中,对应于拟南芥ALS376位置处的天冬氨酸被谷氨酸取代(D376E)、ALS574位置处的色氨酸被亮氨酸或甲硫氨酸取代(W574L或W574M)、ALS653位置处的丝氨酸被天冬酰胺或精氨酸取代(S653N或S653R)、或ALS654位置处的甘氨酸被天冬氨酸取代(G654D),其中,氨基酸的位置以拟南芥中相应氨基酸的序列位置为参照;或者,对应于大穗看麦娘ACCase2027位置处的色氨酸被亮氨酸或半胱氨酸取代(W2027L或W2027C),其中,氨基酸的位置以大穗看麦娘Alopecurus myosuroides中相应氨基酸的序列位置为参照。
在另一具体实施方式中,所述突变类型为S653R/G654D,其中,氨基酸的位置以拟南芥中相应氨基酸的序列位置为参照。
在一具体实施方式中,水稻ALS350位置处的天冬氨酸被任何其他氨基酸取代、水稻ALS548位置处的色氨酸被任何其他氨基酸取代、或马铃薯ALS2 561位置处的色氨酸被任何其他氨基酸取代;或者,水稻ACCase2 2038位置处的色氨酸被任何其他氨基酸取代。
在另一具体实施方式中,水稻ALS350位置处的天冬氨酸被谷氨酸取代(D350E)、水稻ALS548位置处的色氨酸被亮氨酸或甲硫氨酸取代(W548L或W548M)、或马铃薯ALS2 561位置处的色氨酸被亮氨酸或甲硫氨酸取代(W561L或W561M);或者,水稻ACCase2 2038位置处的色氨酸被亮氨酸或半胱氨酸取代(W2038L或W2038C)。其中,水稻ALS蛋白氨基酸序列如SEQ ID NO:11所示,马铃薯StALS2蛋白氨基酸序列如SEQ ID NO:19所示,水稻ACCase2蛋白氨基酸序列如SEQ ID NO:13所示。
本发明另外提供了一种具有所述新突变的蛋白或其生物活性片段。
本发明还提供了一种核酸,其包含编码所述蛋白或其生物活性片段的核酸序列或者其互补序列。
本发明另外提供了一种重组表达载体,其包含所述的核酸,以及与之可操作地连接的启动子。
本发明另外还提供了一种表达盒,其中包含所述的核酸。
本发明另外还提供了一种植物细胞,其中包含有所述的表达盒。
本发明进一步还提供了采用所述植物细胞再生成的植物。
本发明另一方面提供了一种生产对于除草剂的抗性或耐受性提高的植物的方法,其中包括所述的植物细胞再生成植物。
本发明另一方面又提供了一种控制植物栽培场所的杂草的方法,其中所述植物包括上述的植物或者通过上述方法制备的植物,所述方法包括对所述栽培场所施用控制杂草有效量的一种或多种除草剂。
本发明另一方面还提供了所述新突变、所述的蛋白或其生物活性片段、所述的核酸、所述的重组表达载体或所述的表达盒在提高植物细胞、植物组织、植物部分或植物的除草剂抗性或耐受性上的应用。
本发明具有如下优异技术效果:
根据顺次编辑产生的新的修复事件形成的序列,设计新靶点,可以在基因组的特定位置连续多次形成突变,极大的丰富DNA断裂后修复事件的类型,实现单次基因编辑无法得到的新的碱基替换、删除及插入突变。即本发明采用的以在先基因编辑修复序列为在后基因编辑靶点的循环打靶方案,可以赋予CRISPR/Cas通过简单敲除实现单碱基编辑和定点精准删除和插入的新功能。
本发明能够实现无外源标记的基因编辑事件筛选,进一步的实现非转基因的基因编辑并能有效筛选编辑事件,能够极大减轻该方法在细胞治疗和生物育种中应用的生物安全性关切。
尤其是本发明提供的植物非转基因瞬时编辑方法,只涉及Cas蛋白和人工合成的小片段gRNA或sgRNA,全程无外源DNA参与,通过连续打靶编辑第一目标基因产生内源抗性筛选标记,能够有效筛选编辑事件,实质并不涉及转基因操作,与化学诱变或辐射诱导育种等同,也不需要连续多代的分离检测外源转基因成分,能够缩短育种周期,保证生物安全性,节约监管和审批成本,在植物精准育种中有巨大的应用前景。
发明详述
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
本文所用术语“基因组”是指存在于生物体的每个细胞或病毒或细胞器中的遗传物质(基因和非编码序列)的全部互补物,和/或从一个亲本作为一个单位(单倍体)遗传的完整染色体组。
术语“基因编辑”是指针对活体有机体的任何遗传信息或基因组的靶向特异性修饰的策略和技术。因此,术语包括基因编码区的编辑,但也包括除基因组的基因编码区之外的区域的编辑。它还包括编辑或改造核(如果存在)以及细胞的其他遗传信息。
术语“CRISPR/Cas核酸酶”可以是基于CRISPR的核酸酶或编码其的核酸序列,包括但不限于:1)Cas9,包括SpCas9,ScCas9,SaCas9,xCas9,VRER-Cas9,EQR-Cas9,SpG-Cas9,SpRY-Cas9,SpCas9-NG,NG-Cas9,NGA-Cas9(VQR)等,2)Cas12,包括LbCpf1,FnCpf1,AsCpf1,MAD7等,或前述基于CRISPR的核酸酶的任何变体或衍生物,优选其中所述至少一个基于CRISPR的核酸酶与相应的野生型序列相比包含突变,使得所获得的基于CRISPR的核酸酶识别不同的PAM序列。如本文所用,“基于CRISPR的核酸酶”是已经在天然存在的CRISPR系统中鉴定的任何核酸酶,其随后从其天然背景中分离,并且其优选已被修饰或组合成感兴趣的重组构建体,适合作为靶向基因组工程的工具。只要最初的基于野生型CRISPR的核酸酶提供DNA识别,即结合特性,任何基于CRISPR的核酸酶都可以使用并任选重新编程或另外突变以适合本发明的各种实施方案。
术语“CRISPR”指代依赖于成簇规律间隔短回文重复序列途径的序列特异性遗传操纵技术,其不同于RNA干扰在转录水平下调节基因表达。
“Cas9核酸酶”和“Cas9”在本文中可互换使用,指的是包括Cas9蛋白或其片段(例如包含Cas9的活性DNA切割结构域和/或Cas9的gRNA结合结构域的蛋白)的RNA指导的核酸酶。Cas9是CRISPR/Cas(成簇的规律间隔的短回文重复序列及其相关系统)基因组编辑系统的组分,能在引导RNA的指导下靶向并切割DNA靶序列形成DNA双链断裂(DSB)。
“Cas蛋白”或“Cas多肽”是指由Cas(CRISPR-相关的)基因编码的多肽。Cas蛋白包括Cas内切核酸酶。Cas蛋白可以是细菌或古细菌蛋白。例如,本文中的I-III型CRISPR Cas蛋白通常起源于原核生物;I型和III型Cas蛋白可以源自于细菌或古细菌物种,而II型Cas蛋白(即Cas9)可以源自于细菌种类。Cas蛋白包括Cas9蛋白、Cpf1蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10、Cas12a、Cas12b或这些的组合或复合物。
“Cas9变体”或“Cas9内切核酸酶变体”是指亲本Cas9内切核酸酶的变体,其中当与crRNA和tracRNA或与sgRNA相缔合时,Cas9内切核酸酶变体保留以下能力:识别、结合DNA靶序列的全部或部分并任选地解旋DNA靶序列的全部或部分、使DNA靶序列的全部或部分产生切口、或切割DNA靶序列的全部或部分。Cas9内切核酸酶变体包括本文所述Cas9内切核酸酶变体,其中所述Cas9内切核酸酶变体不同于亲本Cas9内切核酸酶,其方式为:所述Cas9内切核酸酶变体(当与gRNA复合以形成能够修饰靶位点的、多核苷酸指导的内切核酸酶复合物时)与亲本Cas9内切核酸酶(与相同的gRNA复合以形成能够修饰相同靶位点的、多核苷酸指导的内切核酸酶复合物)相比时具有至少一种改善的特性,例如,但不限于,增加的转化效率、增加的DNA编辑效率、减少的脱靶切割、或其任意组合。
本文所述的Cas9内切核酸酶变体包括当与crRNA和tracrRNA或与sgRNA相缔合时可结合双链DNA靶位点并使双链DNA靶位点产生切口的变体,而亲本Cas内切核酸酶当与crRNA和tracrRNA或与sgRNA相缔合时可在靶位点处结合并使双链断裂(切割)。
“引导RNA”和“gRNA”在本文中可互换使用,指代用于靶向特定基因从而采用CRISPR技术进行校正的引导RNA序列,通常由部分互补形成复合物的crRNA和tracrRNA分子构成,其中crRNA包含与靶序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物(Cas9+crRNA+tracrRNA)与该靶序列序列特异性结合的序列。然而,本领域已知可以设计单一引导RNA(sgRNA),其同时包含crRNA和tracrRNA的特征。
术语“单一引导RNA”和“sgRNA”在本文中可互换使用,并涉及两个RNA分子的合成融合,其中包含可变靶向结构域(与tracrRNA杂交的tracr配对序列连接)的crRNA(CRISPRRNA)与tracrRNA(反式激活CRISPR RNA)融合。sgRNA可以包含可与II型Cas核酸内切酶形成复合物的II型CRISPR/Cas系统的crRNA或crRNA片段和tracrRNA或tracrRNA片段,其中所述引导RNA/Cas核酸内切酶复合物可以将Cas核酸内切酶引导至DNA靶位点,使得Cas核酸内切酶能够识别、任选地结合DNA靶位点、并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。
在某些实施方式中,引导RNA(一个或多个)和Cas9可以作为核糖核蛋白(RNP)复合物递送至细胞。RNP由与gRNA复合的纯化的Cas9蛋白组成,并且在本领域中众所周知RNP可以被有效地递送到多种类型的细胞中,包括但不限于干细胞和免疫细胞(Addgene,Cambridge,MA、Mirus Bio LLC,Madison,WI)。
本文中的原间隔序列毗邻基序(protospacer adjacent motif,PAM)是指与由gRNA/Cas内切核酸酶系统识别的(靶向的)靶序列(前间隔子)邻近的短核苷酸序列。如果靶DNA序列不邻近合适的PAM序列,则Cas内切核酸酶可能无法成功识别所述靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。所述PAM序列可以是任何长度,但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。
如本文所使用的,术语“生物”或“生物体”,包括动物、植物、真菌、细菌等。
如本文所使用的,术语“宿主细胞”,包括植物细胞、动物细胞、真菌细胞、细菌细胞等。
在本发明中,“动物”包括但不限于脊椎动物,如人类、非人哺乳动物、鸟类、鱼类、爬行类、两栖类等,以及无脊椎动物,如昆虫等。
在本发明中,“植物”应理解为能够进行光合作用的任何分化的多细胞生物,特别是单子叶或双子叶植物,例如:(1)粮食作物:稻属(Oryza spp.),例如稻(Oryza sativa)、阔叶稻(Oryza latifolia)、水稻(Oryza sativa)、光稃稻(Oryza glaberrima);小麦属(Triticum spp.),例如普通小麦(Triticum aestivum)、硬粒小麦(T.Turgidumssp.durum);大麦属(Hordeum spp.),例如大麦(Hordeum vulgare)、亚利桑那大麦(Hordeum arizonicum);黑麦(Secale cereale);燕麦属(Avena spp.),例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatuavar.sativa、杂种燕麦(Avena hybrida);稗属(Echinochloa spp.),例如,珍珠粟(Pennisetum glaucum)、高粱(两色高粱(Sorghum bicolor)、高粱(Sorghum vulgare))、黑小麦、玉蜀黍或玉米、粟、稻(rice)、谷子、糜子、两色蜀黍(Sorghum bicolor)、黍子、荞麦属(Fagopyrum spp.)、黍(Panicum miliaceum)、小米(Setaria italica)、沼生菰(Zizaniapalustris)、埃塞俄比亚画眉草(Eragrostis tef)、稷(Panicum miliaceum)、龙爪稷(Eleusine coracana);(2)豆类作物:大豆属(Glycine spp.),例如大豆(Glycine max)、黄豆(Soja hispida)、Soja max)、野豌豆属(Vicia spp.)、豇豆属(Vigna spp.)、豌豆属(Pisum spp.)、芸豆(field bean)、羽扇豆属(Lupinus spp.)、蚕豆属(Vicia)、酸豆(Tamarindus indica)、兵豆(Lens culinaris)、山黧豆属(Lathyrus spp.)、扁豆属(Lablab)、蚕豆、绿豆、红豆、鹰嘴豆;(3)油料作物:花生(Arachis hypogaea)、落花生属(Arachis spp)、胡麻属(Sesamum spp.)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、油棕属(Elaeis)(例如油棕(Eiaeis guineensis)、美洲油棕(Elaeis oleifera))、大豆(soybean)、油菜(Brassicanapus)、芸苔、芝麻、芥菜(Brassicajuncea)、油菜籽油菜(oilseedrape)、油茶、油棕、油橄榄、蓖麻、欧洲油菜(Brassica napus L.)、卡诺拉油菜(canola);(4)纤维作物:剑麻(Agave sisalana)、棉属(棉花、海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、红麻、剑麻、蕉麻、亚麻(Linum usitatissimum)、黄麻、苎麻、大麻(Cannabis sativa)、火麻;(5)水果类作物:枣属(Ziziphus spp.)、香瓜属(Cucumis spp.)、鸡蛋果(Passiflora edulis)、葡萄属(Vitis spp.)、越桔属(Vaccinium spp.)、西洋梨(Pyrus communis)、李属(Prunus spp.)、番石榴属(Psidium spp.)、石榴(Punica granatum)、苹果属(Malus spp.)、西瓜(Citrullus lanatus)、柑桔属(Citrus spp.)、无花果(Ficus carica)、金桔属(Fortunella spp.)、草莓属(Fragaria spp.)、山楂属(Crataegus spp.)、柿树属(Diospyros spp.)、红仔果(Eugenia unifora)、枇杷(Eriobotrya japonica)、龙眼(Dimocarpus longan)、番木瓜(Carica papaya)、椰子属(Cocos spp.)、阳桃(Averrhoacarambola)、狲猴桃属(Actinidia spp.)、扁桃(Prunus amygdalus)、芭蕉属(Musa spp.)(香蕉)、鳄梨属(Persea spp.)(鳄梨(Persea americana))、番石榴(Psidium guajava)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、橄榄(油橄榄(Oleaeuropaea))、番木瓜(Caricapapaya)、椰子(Cocos nucifera)、凹缘金虎尾(Malpighia emarginata)、人心果(Manilkara zapota)、菠萝(Ananas comosus)、番荔枝属(Annona spp.)、柑桔树(柑桔属物种(Citrus spp.))、波罗蜜属(Artocarpus spp.)、荔枝(Litchi chinensis)、茶藨子属(Ribes spp.)、悬钩子属(Rubus spp.)、梨、桃、杏、梅、杨梅、柠檬、金橘、榴莲、橙、草莓(straw berry)、蓝莓、哈密瓜、甜瓜、椰枣、胡桃树、樱桃树;(6)根茎类作物:木薯属(Manihot spp.)、甘薯(Ipomoea batatas)、芋(Colocasia esculenta)、榨菜、洋葱、荸荠、油莎草、山药;(7)蔬菜类作物:菠菜属(Spinacia spp.)、菜豆属(Phaseolus spp.)、莴苣(Lactuca sativa)、苦瓜属(Momordica spp)、欧芹(Petroselinum crispum)、辣椒属(Capsicum spp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanumintegrifolium)或蕃茄(Solanum lycopersicum))、蕃茄属(Lycopersicon spp.)(例如西红柿(Lycopersicon esculentum)、蕃茄(Lycopersicon lycopersicum)、梨形蕃茄(Lycopersicon pyriforme))、硬皮豆属(Macrotyloma spp.)、无头甘蓝(kale)、棱角丝瓜(Luffa acutangula)、小扁豆(lentil)、秋葵(okra)、洋葱(onion)、马铃薯(potato)、洋蓟(artichoke)、芦笋(asparagus)、西兰花(broccoli)、球芽甘蓝(Brussels sprouts)、卷心菜(cabbage)、胡萝卜(carrot)、花椰菜(cauliflower)、芹菜(celery)、羽衣甘蓝(collardgreens)、西葫芦(squash)、冬瓜(Benincasa hispida)、石刁柏(Asparagus officinalis)、旱芹(Apium graveolens)、苋属(Amaranthus spp.)、葱属(Allium spp.)、秋葵属(Abelmoschus spp.)、苦苣(Cichorium endivia)、南瓜属(Cucurbita spp.)、芫荽(Coriandrum sativum)、埃塞俄比亚芥(B.carinata)、萝卜(Rapbanus sativus)、芸苔属(Brassica)物种(例如例如欧洲油菜(Brassica napus)、芜菁亚种(Brassica rapa ssp.)、卡诺拉油菜(canola)、油籽油菜(oilseed rape)、芜菁油菜(turnip rape)、芥菜、甘蓝、黑芥、油菜籽油菜)、孢子甘蓝、茄科植物(茄子)、甜椒、黄瓜、丝瓜、白菜、油菜、甘蓝、葫芦、韭菜、莲、藕、生菜;(8)花卉作物:小金莲花(Tropaeolum minus)、金莲花(Tropaeolummajus)、美人蕉(Canna indica)、仙人掌属(Opuntia spp.)、万寿菊属(Tagetes spp.)、兰花、文殊兰、君子兰、朱顶红、玫瑰、月季、茉莉花、郁金香、樱花、牵牛花、金盏花、荷花、雏菊、康乃馨、矮牵牛花、郁金香、百合、梅花、水仙、迎春、报春、瑞香、山茶、白玉兰、紫玉兰、琼花、君子兰、海棠、牡丹、芍药、丁香、杜鹃、西洋杜鹃、含笑、紫荆、棣棠、锦带花、连翘、云南黄馨、金雀花、仙客来、蝴蝶兰、石斛、风信子、鸢尾、马蹄莲、金盏菊、百枝莲、四季海棠、吊钟海棠、竹节海棠、天竺葵、绿萝;(9)药用作物:红花(Carthamus tinctorius)、薄荷属(Menthaspp.)、波叶大黄(Rheum rhabarbarum)、番红花(Crocus sativus)、枸杞、玉竹、黄精、知母、麦冬、贝母、郁金、砂仁、何首乌、大黄、甘草、黄芪、人参、三七、五加、当归、川芎、北柴胡、曼佗罗、洋金花、薄荷、益母草、藿香、黄芩、夏枯草、除虫菊、银杏、金鸡纳树、天然橡胶树、苜蓿、胡椒、板蓝根、白术;(10)原料作物:橡胶、蓖麻(Ricinus communis)、油桐、桑、忽布、桦、桤木、漆树;(11)牧草作物:冰草属(Agropyron spp.)、车轴草属(Trifolium spp.)、芒(Miscanthus sinensis)、狼尾草属(Pennisetum sp.)、虉草(Phalaris arundinacea)、柳枝稷(Panicum virgatum)、草原草(prairiegrasses)、印度草(Indiangrass)、大须芒草(Big bluestem grass)、梯牧草(Phleum pratense)、草皮草(turf)、莎草科(高山嵩草、脚苔草(Carex pediformis)、低苔草)、苜蓿、梯牧草、紫花苜蓿、草木犀、紫云英、柽麻、田菁、红萍、水葫芦、紫穗槐、羽扇豆、三叶草、沙打旺、水浮莲、水花生、黑麦草;(12)糖料作物:甘蔗(甘蔗属物种(Saccharum spp.))、甜菜(Beta vulgaris);(13)饮料作物:大叶茶(Camellia sinensis)、茶(Camellia Sinensis)、茶树(tea)、咖啡(咖啡属物种(Coffeaspp.))、可可树(Theobroma cacao)、蛇麻花(啤酒花);(14)草坪植物:固沙草(Ammophilaarenaria)、早熟禾属(Poa spp.)(草地早熟禾(Poa pratensis)(蓝草))、剪股颖属物种(Agrostis spp.)(剪股颖、匍匐剪股颖(Agrostis palustris))、黑麦草属物种(Loliumspp.)(黑麦草)、羊茅属物种(Festuca spp.)(羊茅)、结缕草属物种(Zoysia spp.)(结缕草(Zoysiajaponica))、狗牙根属物种(Cynodon spp.)(百慕大草、狗牙根)、侧钝叶草(Stenotaphrum secunda tum)(圣奥古斯丁草)、雀稗属物种(Paspalum spp.)(巴哈草)、假俭草(Eremochloa ophiuroides)(百足草)、地毯草属物种(Axonopus spp.)(地毯草)、指形垂穗草(Bouteloua dactyloides)(野牛草)、垂穗草属变种物种(Bouteloua var.spp.)(格兰马草)、马唐(Digitariasanguinalis)、香附子(Cyperusrotundus)、短叶水蜈蚣(Kyllingabrevifolia)、阿穆尔莎草(Cyperusamuricus)、加拿大飞蓬(Erigeroncanadensis)、天胡荽(Hydrocotylesibthorpioides)、鸡眼草(Kummerowiastriata)、地锦(Euphorbiahumifusa)、耕地堇菜(Violaarvensis)、白颖苔草、异穗苔草、草皮草(turf);(15)树木作物:松属(Pinus spp.)、柳属(Salix sp.)、槭树属(Acer spp.)、木槿属(Hibiscus spp.)、桉属(Eucalyptus sp.)、银杏(Ginkgo biloba)、箣竹属(Bambusa sp.)、杨属(Populus spp.)、牧豆树属(Prosopis spp.)、栎属(Quercusspp.)、刺葵属(Phoenix spp.)、山毛榉属(Fagus spp.)、吉贝(Ceiba pentandra)、樟属(Cinnamomum spp.)、黄麻属(Corchorus sp.)、南方芦苇(Phragmites australis)、酸浆属(Physalis spp.)、山蚂蝗属(Desmodium spp.)、杨、常春藤、白杨、珊瑚树、银杏、栎类、臭椿、木荷、冬青、悬铃木、女贞、大叶黄扬、落叶松、黑荆树、马尾松、思茅松,云南松、南亚松、油松、红松、黑胡桃、柠檬、悬铃木、蒲桃、珙桐、木棉、爪哇木棉、洋紫荆、羊蹄甲、雨树、合欢、龙牙花、刺桐、广玉兰、苏铁、紫薇、针叶树、乔木、灌木;(16)坚果作物:巴西栗(Bertholletia excelsea)、栗属(Castanea spp.)、榛属(Corylus spp.)、山核桃属(Caryaspp.)、核桃属(Juglans spp.)、阿月浑子(Pistacia vera)、腰果(Anacardiumoccidentale)、澳洲坚果(全缘叶澳洲坚果(Macadamia integrifolia))、碧根果、夏威夷果、开心果、巴旦木以及产生坚果的植物;(17)其他:拟南芥、臂形草、蒺藜草、大狗尾草、牛筋草、Cadaba farinosa、藻类(algae)、Carex elata、观赏植物、大果假虎刺(Carissamacrocarpa)、菜蓟属(Cynara spp.)、野胡萝卜(Daucus carota)、薯蓣属(Dioscoreaspp.)、蔗茅属(Erianthus sp.)、苇状羊茅(Festuca arundinacea)、萱草(Hemerocallisfulva)、百脉根属(Lotus spp.)、Luzula sylvatica、紫苜蓿(Medicago sativa)、草木樨属(Melilotus spp.)、黑桑(Morus nigra)、烟草属(Nicotiana spp.)、木犀榄属(Oleaspp.)、鸟足豆属(Ornithopus spp.)、欧防风(Pastinaca sativa)、接骨木属(Sambucusspp.)、白芥属(Sinapis sp.)、蒲桃属(Syzygium spp.)、鸭茅状摩擦禾(Tripsacumdactyloides)、Triticosecale rimpaui、香堇(Viola odorata)等。
在一具体实施方式中,所述植物选自水稻、玉米、小麦、大豆、向日葵、高粱、油菜、苜蓿、棉花、大麦、谷子、甘蔗、番茄、烟草、木薯、马铃薯、甘薯、白菜、甘蓝、黄瓜、月季、绿萝、西瓜、甜瓜、草莓、蓝莓、葡萄、苹果、柑橘、桃、梨、香蕉等。
如本文所使用的,术语“植物”包括整个植物和任何后代、植物的细胞、组织、或部分。术语“植物部分”包括植物的任何部分,包括,例如但不限于:种子(包括成熟种子、没有种皮的未成熟胚、和不成熟的种子);植物插条(plant cutting);植物细胞;植物细胞培养物;植物器官(例如,花粉、胚、花、果实、芽、叶、根、茎,和相关外植体)。植物组织或植物器官可以是种子、愈伤组织、或者任何其他被组织成结构或功能单元的植物细胞群体。植物细胞或组织培养物能够再生出具有该细胞或组织所来源的植物的生理学和形态学特征的植物,并能够再生出与该植物具有基本上相同基因型的植物。与此相反,一些植物细胞不能够再产生植物。植物细胞或组织培养物中的可再生细胞可以是胚、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、丝、花、果仁、穗、穗轴、壳、或茎。
植物部分包括可收获的部分和可用于繁殖后代植物的部分。可用于繁殖的植物部分包括,例如但不限于:种子;果实;插条;苗;块茎;和砧木。植物的可收获部分可以是植物的任何有用部分,包括,例如但不限于:花;花粉;苗;块茎;叶;茎;果实;种子;和根。
植物细胞是植物的结构和生理单元。如本文所使用的,植物细胞包括原生质体和具有部分细胞壁的原生质体。植物细胞可以是处于分离的单个细胞或细胞聚集体的形式(例如,松散愈伤组织和培养的细胞),并且可以是更高级组织单元(例如,植物组织、植物器官、和植物)的一部分。因此,植物细胞可以是原生质体、产生配子的细胞,或者能够再生成完整植物的细胞或细胞的集合。因此,在本文的实施方案中,包含多个植物细胞并能够再生成为整株植物的种子被认为是一种“植物部分”。
如本文所使用的,术语“原生质体”是指细胞壁被完全或部分地除去、其脂双层膜裸露的植物细胞。典型地,原生质体是没有细胞壁的分离植物细胞,其具有再生成细胞培养物或整株植物的潜力。
植物“后代”包括植物的任何后续世代。
术语“细菌”意旨所有的原核生物,包括原核生物界(Kingdom Procaryotae)中的所有生物。术语“细菌”包括认为是细菌的所有微生物,包括支原体属(Mycoplasma)、衣原体属(Chlamydia)、放线菌属(Actinomyces)、链霉菌属(Streptomyce)和立克次氏体属(Rickettsia)。所有形式的细菌均包括在该定义内,包括球菌、杆菌、螺旋菌、原生质球、原生质体等。在该术语中还包括为革兰氏阴性或革兰氏阳性的原核生物。“革兰氏阴性”和“革兰氏阳性”意指使用本领域众所周知的革兰氏染色法的染色模式(例如参见Finegold和Martin,Diagnostic Microbiology,6th Ed.,CV MosbySt.Louis,pp.13-15[1982])。“革兰氏阳性菌”为保留用于革兰氏染色的原染料的细菌,导致染色的细胞在显微镜下表现出深蓝色至紫色。“革兰氏阴性菌”不保留用于革兰氏染色的原染料,但被复染剂染色。因此,革兰氏阴性菌在革兰氏染色反应后呈红色。
本文所用的术语“真菌”用以指真核生物,诸如霉菌和酵母,包括双态性真菌。
“除草剂耐受性”和“除草剂抗性”两个术语可以互换使用,均指的是对除草剂的耐受性和对除草剂的抗性。“除草剂耐受性提高”和“除草剂抗性提高”是指对所述除草剂的耐受性或抗性与含有野生型基因的植物相比提高。
术语“野生型”指的是可以在自然界中被发现存在的核酸分子或蛋白质。
在本发明中,术语“场所”包括栽培本发明植物的场地例如土壤,也包括例如植物种子、植物苗以及长成的植物。术语“控制杂草有效量”指的是除草剂的量足以影响目标杂草的生长或发育,例如阻止或抑制目标杂草的生长或发育,或者杀灭所述杂草。有利地,所述控制杂草有效量不会显著影响本发明植物种子、植物苗或植物的生长和/或发育。本领域技术人员可以通过常规实验确定这样的控制杂草有效量。
如本文所使用的“靶DNA”为包含“靶位点”或“靶序列”的DNA多核苷酸。
“裂解”意指DNA分子的共价骨架的断裂。可通过各种各样的方法来开始裂解,所述方法包括但不限于磷酸二酯键的酶水解或化学水解。单链裂解和双链裂解均是可能的,并且双链裂解可由于两个相异单链裂解事件而发生。DNA裂解可导致平端或交错端产生。在某些实施方案中,包含靶向DNA的RNA和定点修饰多肽的复合物用于靶向的双链DNA裂解。
术语“基因”包括表达功能性分子(诸如但不限于,特定蛋白质)的核酸片段,包括在编码序列之前(5’非编码序列)和之后(3’非编码序列)的调节序列。
“编码”具体RNA的DNA序列为转录成RNA的DNA核酸序列。DNA多核苷酸可编码翻译成蛋白质的RNA(mRNA),或DNA多核苷酸可编码不翻译成蛋白质的RNA(例如tRNA、rRNA或靶向DNA的RNA;又称为“非编码”RNA或“ncRNA”)。
“多肽”、“肽”和“蛋白”在本发明中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白”还可包括修饰形式,包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。
“生物活性片段”是指从蛋白质的N和/或C末端缺失一或多个氨基酸残基而仍保留其功能活性的片段。
对于说明书中所用的有关氨基酸取代的术语,第一个字母代表特定序列某一位置上天然存在的氨基酸,后面的数字代表所述对应序列中的位置,第二个字母代表取代该天然氨基酸的不同氨基酸。譬如W574L表示第574位的色氨酸被亮氨酸取代。对于双重或多重突变,各突变之间以“/”隔开。
术语“多核苷酸”和“核酸”可以互换使用,包括DNA、RNA或者其杂交体,可以是双链或单链的。
术语“核苷酸序列”和“核酸序列”均是指DNA或RNA中碱基的排列顺序。
如本发明所用,“表达盒”“表达载体”和“表达构建体”是指适于感兴趣的核苷酸序列在植物中表达的载体如重组载体。“表达”指功能产物的产生。例如,核苷酸序列的表达可指核苷酸序列的转录(如转录生成mRNA或功能RNA)和/或RNA翻译成前体或成熟蛋白质。
本发明的“表达构建体”可以是线性的核酸片段、环状质粒、病毒载体,或者,在一些实施方式中,可以是能够翻译的RNA(如mRNA)。
本发明的“表达构建体”可包含不同来源的调控序列和感兴趣的核苷酸序列,或相同来源但以不同于通常天然存在的方式排列的调控序列和感兴趣的核苷酸序列。
术语“重组表达载体”或“DNA构建体”在本文中可互换使用,是指包含载体和至少一个插入物的DNA分子。通常出于表达和/或繁殖插入物的目的或出于构建其它重组核苷酸序列而产生重组表达载体。插入物可以可操作的或可以不可操作地连接至启动子序列并且可以可操作的或可以不可操作地连接至DNA调节序列。
“调控序列”和“调控元件”可互换使用,指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。植物表达调控元件指的是能够在植物中控制感兴趣的核苷酸序列转录、RNA加工或稳定性或者翻译的核苷酸序列。
调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”指能够控制另一核酸片段转录的核酸片段。在本发明的一些实施方案中,启动子是能够控制植物细胞中基因转录的启动子,无论其是否来源于植物细胞。启动子可以是组成型启动子或组织特异性启动子或发育调控启动子或诱导型启动子。
“组成型启动子”指一般将引起基因在多数细胞类型中在多数情况下表达的启动子。“组织特异性启动子”和“组织优选启动子”可互换使用,并且指主要但非必须专一地在一种组织或器官中表达,而且也可在一种特定细胞或细胞型中表达的启动子。“发育调控启动子”指其活性由发育事件决定的启动子。“诱导型启动子”响应内源性或外源性刺激(环境、激素、化学信号等)而选择性表达可操纵连接的DNA序列。
如本文中所用,术语“可操作地连接”指调控元件(例如但不限于,启动子序列、转录终止序列等)与核酸序列(例如,编码序列或开放读码框)连接,使得核苷酸序列的转录被所述转录调控元件控制和调节。用于将调控元件区域可操作地连接于核酸分子的技术为本领域已知的。
将核酸分子(例如质粒、线性核酸片段、RNA等)或蛋白质“导入”植物是指用所述核酸或蛋白质转化植物细胞,使得所述核酸或蛋白质在植物细胞中能够发挥功能。本发明所用的“转化”包括稳定转化和瞬时转化。
“稳定转化”指将外源核苷酸序列导入植物基因组中,导致外源基因稳定遗传。一旦稳定转化,外源核酸序列稳定地整合进所述植物和其任何连续世代的基因组中。
“瞬时转化”指将核酸分子或蛋白质导入植物细胞中,执行功能而没有外源基因稳定遗传。瞬时转化中,外源核酸序列不整合进植物基因组中。
除非另外定义,否则本文使用的所有技术术语和科学术语具有与通过本发明所属领域中的普通技术人员通常理解的相同的含义。虽然还可在本发明的实践或测试中使用类似于或等同于本文所述的那些方法和材料的任何方法和材料,但现在描述优选的方法和材料。
本说明书中引用的所有出版物和专利以引用的方式并入本文如同每个单独的出版物或专利均确切地和单独地指出以引用的方式并入一样,并且以引用的方式并入本文以公开和描述与出版物所引用的相关的方法和/或材料。任何出版物的引用为其公开在申请日之前并且不应该解释为承认本发明没有资格先于现有发明的这种出版物。此外,所提供的出版日期可与实际出版日期不同,这可能需要独立证实。
除非具体说明或暗示,如本文中所用,术语“一”、“一个/一种”和“所述”表示“至少一个”。本文提到或引用的所有专利、专利申请和出版物整体引入本文作为参考,其引用程度如同单独地个别引用一样。
附图说明
图1为本发明所述在生物体内产生新突变的方法原理图,图中仅仅以NGG为PAM的Cas9为例;同理也可以应用其它具有不同PAM(如NG等)的Cas9变体。
图2为拟南芥ALS基因W574位点与S653位点gRNA设计示意图。
图3显示了转化两个不同循环打靶载体的拟南芥T2代抗除草剂株系。pQY743和pQY745为载体编号。抗性株系能够正常生根,野生型Col-0和非抗性株系不能生根。
图4为抗甲咪唑烟酸拟南芥T2代株系ALS基因的测序峰图,箭头所指的T由G突变而来,导致了W574L突变。
图5为拟南芥ALS基因W574位点循环打靶方案设计。T-DNA序列表达sgRNA1、sgRNA2、Cas9和HygR四个基因。其中sgRNA1和Cas9形成复合物,切割基因组中ALS的W574密码子,预期经过细胞自发修复形成-G的基因型,该新序列可以被sgRNA2和Cas9形成的复合物识别并切割,经过细胞自发修复形成+T的基因型,导致W574L。
图6显示甲咪唑烟酸筛选的拟南芥抗性苗和ALS W574位点测序结果。
图7为拟南芥ALS基因S653位点循环打靶方案设计。T-DNA序列表达sgRNA1、sgRNA2、Cas9和HygR四个基因。其中sgRNA1和Cas9形成复合物,切割基因组中ALS的S653密码子。经过细胞自发修复形成-G的基因型。该序列可以被sgRNA2和Cas9形成的复合物识别并切割。经过细胞自发修复形成+A的基因型,导致S653N。
图8显示甲咪唑烟酸筛选的拟南芥抗性苗和ALS S653位点测序结果。左侧为抗性苗筛选结果和抗性苗的比例,右侧显示了S653位点的测序峰图和突变类型。
图9为拟南芥ALS基因W574位点循环打靶方案设计。T-DNA序列表达sgRNA1、sgRNA2、Cas9和HygR四个基因。其中sgRNA1和Cas9形成复合物,切割基因组中ALS的W574密码子。经过细胞自发修复形成+A的基因型。该序列可以被sgRNA2和Cas9形成的复合物识别并切割。经过细胞自发修复形成-G的基因型,导致W574M。其中两次切割利用了不同的PAM位点。
图10为水稻ACCase2基因W2038位点循环打靶方案设计,该位点对应大穗看麦娘W2027。T-DNA序列表达sgRNA1、sgRNA2、Cas9和HygR四个基因。其中sgRNA1和Cas9形成复合物,切割基因组中ACCase的W2038密码子。经过细胞自发修复形成-G的基因型。该序列可以被sgRNA2和Cas9形成的复合物识别并切割。经过细胞自发修复形成+T的基因型,导致W2038L。
图11显示潮霉素(50ug/L)和精喹禾灵(50ug/L)共筛选的抗性水稻愈伤和W2038位点测序结果。
图12为原核表达纯化的SpCas9和NGA-Cas9蛋白聚丙烯酰胺凝胶电泳图。箭头所指的条带为Cas9蛋白条带。
图13显示用琼脂糖凝胶电泳检测纯化的Cas9蛋白在体外对含有OsALS W548靶位点和OsACCase2 W2038靶位点DNA片段的切割活性,可以看到仅在同时加入Cas9蛋白和sgRNA片段的条件下,DNA片段能够被切割为预期大小。
图14为RNP转化水稻原生质体OsALS W548靶点测序峰图,该位点对应拟南芥ALSW574位点。箭头所指处除原始的G碱基信号峰外,还有突变得到的T碱基信号峰,导致了W548L突变。
图15为50ug/L精喹禾灵筛选RNP编辑OsACCase2 W2038位点的水稻抗性愈伤。箭头所指为抗性愈伤。
图16为抗性愈伤分化出的水稻苗OsACCase2 W2038靶点测序峰图。箭头所指处的T由G突变而来,导致了W2038L突变。
图17为T1代OsACCase2 W2038L编辑苗对高效氟吡甲禾灵的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左4为野生型淮稻5号和两个RNP基因枪转化T1代W2038L编辑株系QY367-7-12、QY367-7-18使用5克每亩活性成分的高效氟吡甲禾灵处理的结果。可见编辑株系产生了对高效氟吡甲禾灵的抗性。
图18为T1代OsACCase2 W2038L编辑苗对精喹禾灵的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左4为野生型淮稻5号和两个RNP基因枪转化T1代W2038L编辑株系QY367-5-10、QY367-5-21使用5克每亩活性成分的精喹禾灵处理的结果。可见编辑株系产生了对精喹禾灵的抗性。
图19为50ug/L精喹禾灵筛选RNP编辑同时编辑OsACCase2 W2038位点和OsBADH2基因的水稻抗性愈伤。箭头所指为抗性愈伤。
图20为T0代双位点编辑苗OsACCase2 W2038靶点测序峰图。箭头所指处的T由G突变而来,导致了W2038L突变。
图21为T0代双位点编辑苗OsBADH2靶点测序峰图。箭头所指处发生了+A的纯合突变。
图22为5mg/L啶磺草胺筛选RNP编辑同时编辑OsALS W548位点和OsSWEET14基因的水稻抗性愈伤。箭头所指为抗性愈伤。
图23为T0代双位点编辑苗OsALS W548靶点测序峰图。箭头所指处同时存在G碱基和T碱基的信号峰,导致了W548L突变。
图24为T0代双位点编辑苗OsSWEET14靶点测序峰图。箭头所指处显示发生了-C的纯合突变。
图25为T1代OsALS W548位点和OsSWEET14双位点编辑苗对烟嘧磺隆的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左3为野生型淮稻5号和RNP基因枪转化T1代W548L编辑株系QY360-7-11使用4克每亩活性成分的烟嘧磺隆处理的结果。可见编辑株系产生了对烟嘧磺隆的抗性。
图26为T1代OsALS W548位点和OsSWEET14双位点编辑苗对氟唑磺隆的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左3为野生型淮稻5号和RNP基因枪转化T1代W548L编辑株系QY360-7-9使用2克每亩活性成分的氟唑磺隆处理的结果。可见编辑株系产生了对氟唑磺隆的抗性。
图27为T1代OsALS W548位点和OsSWEET14双位点编辑苗对甲基咪草烟的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左3为野生型淮稻5号和RNP基因枪转化T1代W548L编辑株系QY360-7-11使用7克每亩活性成分的甲基咪草烟处理的结果。可见编辑株系产生了对甲基咪草烟的抗性。
图28为T1代OsALS W548位点和OsSWEET14双位点编辑苗对啶磺草胺的抗性测试。图中左1为野生型淮稻5号水处理对照,左2至左4为野生型淮稻5号和RNP基因枪转化T1代W548L编辑株系QY360-7-2、QY360-7-11使用2克每亩活性成分的啶磺草胺处理的结果。可见编辑株系产生了对啶磺草胺的抗性。
图29为293T细胞中HBB基因连续打靶方案。其中,A代表293T细胞中HBB基因连续打靶靶点设计;B代表293T细胞中HBB基因连续打靶各编辑载体转化48小时后的转化效率;C代表293T细胞中HBB基因连续打靶和单位点打靶产生的基因编辑类型的比例;WT:野生型,indel:删除或插入的基因型,C->T SNP:在切口处产生C到T的碱基替换的基因型。
序列说明
本发明所涉及的主要序列总结如下,并且在序列表中提供了相关的序列。
/>
具体实施方式
以下结合实例,对本发明作进一步说明。下面的说明是采用举例的方式,但是本发明的保护范围不应局限于此。下述实施例中的实验方法,如无特殊说明,均为常用分子生物学、组织培养技术和农学手册所记载的方法。例如,具体步骤可参见:《Molecular Cloning:A Laboratory Manual(3rd edition)》(Sambrook,J.,Russell,David W.,2001,ColdSpring Harbor),《Plant Propagation by Tissue Culture》(Edwin F.George,MichaelA.Hall,Geert-Jan De Klerk,2008,Springer)。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。
实施例1针对拟南芥ALS基因W574及S653位点循环打靶设计可预期的碱基替换
A.实验材料
1.拟南芥材料
拟南芥Col-0野生型为双子叶植物模式品种,原始种子由中国农业大学植物保护学院杂草学教研室提供,本实验室按照本领域标准方法扩繁保存。
2.载体
pCBC-dT1T2(Xing HL,Dong L,Wang ZP,Zhang HY,Han CY,Liu B,Wang XC,ChenQJ2014.A CRISPR/Cas9 toolkit for multiplex genome editing in plants.BMC PlantBiol.Nov29;14(1):327具体信息见https://www.addgene.org/50590/)、pHEE401E(具体信息见Wang ZP,Xing HL,Dong L,Zhang HY,Han CY,Wang XC,Chen QJ GenomeBiol.2015Jul 21;16:144.doi:10.1186/s13059-015-0715-0.https://www.addgene.org/71287/)、pHEE401E-NG(将Nishimasu et al.2018Engineered CRISPR-Cas9 nucleasewith expanded targeting space.Science361(6408):1259-1262.doi:10.1126/science.aas9129报道中的突变引入到pHEE401E中,构建成识别NG PAM的载体pHEE401E-NG)载体质粒可自Addgene网站商购获得或由本实验室按照常规分子生物学方法构建,并由本实验室保存。
3.主要仪器设备
移液枪、水浴锅、PCR仪(Bio-rad T100)、电泳仪(威克斯WIX-EP600)、凝胶成像仪、电热鼓风干燥机、离心机(Eppendorf 5424R)、高通量组织破碎仪、摇床、电子天平、pH计等。
4.主要试剂
高保真DNA聚合酶(购自Tsingke生物)、琼脂糖凝胶回收试剂盒与质粒提取试剂盒(购自思科捷)、BsaI与T4 DNA连接酶(购自NEB)、Trans5α感受态细胞与EHA105感受态细胞(购自北京全式金),GV3101农杆菌感受态(购自上海昂羽生物),Tris、EDTA、卡那霉素、头孢抗生素、潮霉素、琼脂糖、酵母粉、胰蛋白胨、NaCl(购自生工生物)、MS粉末、蔗糖、Silwet-77、潮霉素(购自索莱宝公司),核酸染料(Dured)、无水乙醇(购自国药)等。
5.主要溶液配置
1)种子消毒液:4mL10%SDS,20mLNaClO,加水定容至200mL。
2)SDS提取缓冲液:40mL 1M Tris·HCl(pH 8.0),50mL 0.1M EDTA,10mL 5MNaCl,10mL 10%SDS,加水定容至200mL。
3)侵染液:蔗糖1.5g,Silwet-77 9μL,加入30mL超纯水。
4)LB固体培养基:酵母粉5g,胰蛋白胨10g,NaCl 10g,琼脂15g,加水定容至1L,121℃灭菌15分钟后倒平板备用。
5)50×TAE母液:Tris 242g,Na2EDTA·2H2O 37.2g,加入800mL超纯水,充分搅拌溶解,加入57.1mL醋酸,充分搅拌,最后用去离子水定容至1L,室温保存。
6)MS固体培养基:称取4.42g MS粉末,10g蔗糖,加入800mL超纯水,调pH至5.8,加水定容至1L,加入10g植物凝胶,121℃灭菌15分钟后倒平板备用。
B.实验方法
1.CRISPR/Cas9双靶点载体设计与构建
1.1靶点设计
拟南芥ALS基因序列如SEQ ID NO:2所示,以拟南芥ALS574位点附近AGA为PAM设计19个碱基的靶点序列gRNA1:5’-GCATGGTTATGCAATGGGA-3’,预测经过编辑后在PAM前3-4位之间会删除一个碱基G,然后以删除后的序列设计第二个靶点序列gRNA2:5’-GGCATGGTTATGCAATGGA-3’,预测经过第二次编辑会插入一个碱基T,从而实现TGG-TTG的转换,如图2所示。
同样的,以拟南芥ALS653位点附近TGG为PAM设计19个碱基的靶点序列gRNA3:5’-TGCCGATGATCCCGAGTGG-3’,预测经过编辑后在PAM前3-4位之间会删除一个碱基G,然后以删除后的序列设计第二个靶点序列gRNA4:5’-TTGCCGATGATCCCGATGG-3’,预测经过第二次编辑会插入一个碱基A,从而实现AGT-AAT的转换,如图2所示。
1.2载体构建
按照Xing HL,Dong L,Wang ZP,Zhang HY,Han CY,Liu B,Wang XC,Chen QJ2014.A CRISPR/Cas9 toolkit for multiplex genome editing in plants.BMC PlantBiol.Nov 29;14(1):327中所述方法进行。具体而言,以dT1T2质粒为模板分别扩增ALS574与653位点双靶点片段,构建sgRNA表达盒。BsaI酶切pHEE401E、pHEE401E-NG载体骨架,切胶回收,目的片段经酶切后直接用于连接反应。采用T4 DNA连接酶连接载体骨架与目的片段,转化连接产物至Trans5α感受态细胞,挑取不同的单克隆测序,测序正确后利用思科捷高纯度质粒小量提取试剂盒抽提质粒,得到重组质粒,分别命名为pQY743、pQY745。
2.靶点检测引物的设计
靶点检测引物以ALS574、ALS653靶点为中心,上游检测引物距ALS574靶点约100bp左右,下游检测引物距ALS653靶点约280bp。引物序列574/653checking-F:5’AT-TGACGGAGATGGAAGCTT3’,574/653checking-R:5’CCAAACTGAGCCAGTCACAA3'。
3.拟南芥遗传转化体系的建立
3.1农杆菌转化
将构建好的重组质粒转化农杆菌GV3101感受态细胞,得到重组农杆菌。
3.2农杆菌侵染液的制备
1)挑取活化的农杆菌接种于30ml YEP液体培养基(含25mg/L Rif和50mg/L Kan)中,28℃200转/分钟振荡培养过夜至OD600值为1.0-1.5左右。
2)6000转/分钟离心10分钟收集菌体,弃上清。
3)用侵染液(无须调节pH)重新悬浮菌体至OD600=0.8左右备用。
3.3拟南芥转化
1)植株转化之前注意植株是否生长良好,花序茂盛,无胁迫反应,第一次转化株高20厘米即可进行。若土壤干燥可适当浇一些水。转化前一天用剪刀将已长出的角果剪去。
2)将待转化植株花序浸泡于上述溶液中30秒-1分钟,期间轻轻搅动,浸润后的植株上应该有一层液体膜。
3)转化完成后植株放于黑暗环境中暗培养24小时,然后取出放于正常光照环境下生长。
4)一周以后即可按同样的方法进行第二次转化。
3.4种子收获
待种子成熟后即可进行收获,收获后置于37℃烘箱一周左右烘干种子。
4.转基因植株的筛选
种子经过消毒液处理5分钟,用去离子水洗5遍后均匀铺于MS筛选培养基(含30μg/mL潮霉素、100μg/mL头孢霉素)上,将培养基放于光照培养箱培养(温度22℃,16小时光照,8小时黑暗,光照强度100-150μmol/m2/s,湿度75%),一周后选取阳性幼苗移栽至土壤。
5.T1突变植株的检测
5.1基因组DNA提取
1)剪取拟南芥叶片约于2mL离心管中,加入钢珠,利用高通量组织破碎仪进行叶片研磨。
2)待研磨充分后,加入400μL SDS提取缓冲液,上下颠倒混匀,置于65℃水浴锅中孵育15分钟,期间每隔5分钟颠倒混匀一次。
3)13000转/分钟离心5分钟。
4)吸取300μL上清液转移至一新的1.5mL离心管中,向离心管中加入等体积经过-20℃预冷的异丙醇,将离心管置于-20℃1小时或者过夜。
5)13000转/分钟离心10分钟,去掉上清液。
6)向离心管中加入500μL 70%乙醇洗涤沉淀,离心后倒掉洗涤液(注意不要倒掉沉淀),置于室温晾干后,加入30μL超纯水溶解DNA,置于-20℃保存DNA。
5.2PCR扩增
以提取的T1植株基因组为模板,用检测引物进行靶点片段扩增,吸取5μL扩增产物经1%琼脂糖凝胶电泳检测,并经凝胶成像仪成像,剩余产物交由测序公司直接进行测序。
6.T2突变植株的检测
单株收获T1株系的种子后,选取两个载体不同株系的种子铺于甲咪唑烟酸筛选培养基(MS培养基+0.24μg/mL甲咪唑烟酸)上进行筛选,一周后移栽阳性幼苗至土壤并进行分子检测,方法同步骤5。
所用引物及序列:
引物名称 序列(5’-3’)
ALS574-F ATATATGGTCTCGATTGGCATGGTTATGCAATGGGAGTTTTAGAGCTAGAAATA
ALS574-R ATTATTGGTCTCGAAACTCCATTGCATAACCATGCCCAATCTCTTAGTCGACTC
ALS653-F ATATATGGTCTCGATTGTGCCGATGATCCCGAGTGGGTTTTAGAGCTAGAAATA
ALS653-R ATTATTGGTCTCGAAACCCATCGGGATCATCGGCAACAATCTCTTAGTCGACTC
ALS574/653checking-F ATTGACGGAGATGGAAGCTT
ALS574/653checking-R CCAAACTGAGCCAGTCACAA
C.试验结果
1.T1植株基因型检测
T1种子经过MS潮霉素抗性培养基筛选,pQY743载体共得到32株阳性苗,pQY745载体共得到18株阳性苗。每个载体选择10株幼苗提取叶片基因组DNA检测靶点,发现ALS574位点T1代均未发生编辑,而ALS653位点均有符合设计预期的编辑事件发生。检测结果如表1所示:
表1T1植株突变类型
2.T2代种子筛选结果
单株收获T2代种子后,铺于甲咪唑烟酸抗性培养基筛选,可以看到野生型Col-0在抗性培养基上不能生长,突变株系阳性植株在抗性培养基上能够正常生长,如图3所示。
每个载体选择10株幼苗取叶片提取基因组DNA进行分子检测,发现pQY743载体有6株发生了符合预期的纯合突变,由TGG变为TTG,如图4所示。另有1株为杂合突变,3株为嵌合突变。检测结果如表2所示。
表2T2植株突变类型
以上结果表明,使用本发明顺次连续打靶的技术方案,可以实现对目标位点设计预期突变并实现,能够通过设计有先后顺序的sgRNA的组合仅需Cas9蛋白即可实现碱基替换突变。
实施例2针对拟南芥ALS基因W574及S653位点循环打靶实现多种突变类型
载体设计,构建,拟南芥转化筛选操作步骤参照实施例1,对AtALS W574位点,设计载体与实施例1相同,载体示意图见图5,通过在特定位置先-G再+T,预期实现W574L突变。载体转化拟南芥在T1代未检测到编辑事件,对转基因拟南芥T2代使用0.24mg/L甲咪唑烟酸筛选,得到大量抗除草剂植株,如图6左侧所示,对这些抗性植株进行分子检测,PCR产物测序结果显示,W574位点不仅出现了预期的W574L突变,也出现了另外一种抗性突变W574M,见图6右侧。
对AtALS S653位点,设计载体与实施例1相同,载体示意图见图7,通过在特定位置先-G再+A,预期实现S653N突变。载体转化拟南芥在T1代检测到S653N的预期编辑事件,对转基因拟南芥T2代继续使用0.24mg/L甲咪唑烟酸筛选,得到大量抗除草剂植株,如图8左侧所示,对这些抗性植株进行分子检测,PCR产物测序结果显示,S653位点不仅出现了预期的S653N突变,也出现了另外两种抗性突变S653R、S653R/G654D,见图8右侧。
以上结果表明,使用本发明顺次连续打靶的技术方案,通过设计有先后顺序的sgRNA的组合仅需配套Cas9蛋白,除实现对目标位点设计的预期突变外,还能够产生多种功能突变类型,适合作为一种创制新功能突变的工具。
实施例3针对拟南芥ALS基因W574位点附近利用不同的PAM进行循环打靶产生W574M抗性突变
载体设计,构建,拟南芥转化筛选操作步骤参照实施例1,与实施例1不同之处在于,对AtALS W574位点附近序列5’CTTGGCATGGTTATGCAATGgg3’首先以更靠近W574位点的GG为PAM,设计sgRNA1:5’CTTGGCATGGTTATGCAATG3’带下划线为W574位点,斜体为NG PAM,预测切割修复将+A后形成新序列5’CTTGGCATGGTTATGCAAATGGGAag3’,以AG为新的PAM位点设计sgRNA2:5’CTTGGCATGGTTATGCAAATGGGA3’,经过细胞自发修复形成-G的基因型,导致W574M,即本方案中两次切割使用了不同的PAM位点,载体示意图见图9。使用该载体转化拟南芥,对T1代转基因株系进行基因型检测,从中检测到W574M的预期编辑事件,植株表现对甲咪唑烟酸处理的抗性。
结果表明,使用本发明的技术方案,利用不同的PAM进行循环打靶编辑,能够在更宽的序列范围内进行编辑,实现氨基酸替换。
实施例4针对水稻ALS基因D350和W548位点设计可预期的碱基替换
将Nishimasu et al.2018Engineered CRISPR-Cas9 nuclease with expandedtargeting space.Science 361(6408):1259-1262.doi:10.1126/science.aas9129报道中的突变引入到pHUE411(A CRISPR/Cas9 toolkit for multiplex genome editing inplants.Xing HL,Dong L,Wang ZP,Zhang HY,Han CY,Liu B,Wang XC,Chen QJ.BMC PlantBiol.2014Nov 29;14(1):327.10.1186/s12870-014-0327-y具体信息见https://www.addgene.org/71287/)中,构建成识别NG PAM的载体pHUE411-NG。
水稻ALS基因序列如SEQ ID NO:12所示,以5’GGCGTGCGGTTTGATGATCG3’(带下划线为对应拟南芥ALS-D376的OsALS-D350位点)和预测在先编辑后生成的新序列5’GGCGTGCGGTTTGATGACG3’为靶点,按照Xing HL,Dong L,Wang ZP,Zhang HY,Han CY,Liu B,Wang XC,Chen QJ.BMC Plant Biol.2014所述方法,构建双靶点载体,预期实现GAT-GAA的转换,产生OsALS D350E突变。
以5’GGTATGGTTGTGCAATGGGA3’(带下划线为对应拟南芥ALS-W574的OsALS-W548位点)和预测在先编辑后生成的新序列5’GGTATGGTTGTGCAATGGA 3’为靶点,构建双靶点载体,预期实现TGG-TTG的转换,产生OsALS W548L突变。
然后将这两个载体转入水稻,获得转基因植株,鉴定获得了预期替换的D350E和W548L的植株。田间抗除草剂生测实验结果表明,D350E和W548L突变体获得了对ALS抑制剂类除草剂的抗性。
实施例5针对水稻ACCase2基因W2038位点设计可预期的碱基替换及筛选多种突变类型
水稻ACCase2基因序列如SEQ ID NO:14所示,OsACCase2 W2038位点对应大穗看麦娘ACCase W2027位点,以靠近该位点的AGG为PAM设计sgRNA1:5’TTCATCCTCGCTAAC-TGGAG3’,预测切割修复将-G后形成新序列,继续以AGG为PAM设计sgRNA2:5’CTTC-ATCCTCGCTAACTGAG3’,再次切割修复后形成+T的基因型,导致W2038L突变,将sgRNA1和sgRNA2构建到pHUE411载体上形成编辑载体,载体示意图见图10。
编辑载体转化水稻品种淮稻5号愈伤组织,经50μg/L潮霉素和50μg/L精喹禾灵共筛选3周后,出现了大量抗性愈伤,如图11左侧所示,取抗性愈伤进行基因型鉴定,发现不仅出现了预期的W2038L突变,也出现了W2038C突变,如图11右侧所示。
以上对水稻基因循环打靶的结果说明本发明的技术方案在单双子叶植物中均适用。
实施例6SpCas9和NGA-Cas9蛋白的表达纯化
1.试验仪器试剂
表3试验仪器
表4试验仪器
2.试验方法
2.1pET15b-Cas9表达载体构建
SpCas9和NGA-Cas9蛋白经植物密码子优化后的DNA序列分别见SEQ ID NO:15和SEQ ID NO:16,序列交金斯瑞合成作为模板DNA。
将NG-Cas9和NGA-Cas9序列分别扩增后,融合(infusion)法将两个片段连接到pET15b表达载体上,转化DH5a,验证后测序。
表5PCR验证扩增体系及引物
2.2蛋白表达纯化
将构建好的表达载体转入大肠杆菌Rosetta(DE3)中,经IPTG诱导表达,收菌裂解后利用Ni-NTA柱进行纯化,具体方法如下:
a)将重组表达载体转化到Rosetta(DE3)菌株中,挑取单克隆到10ml LB培养基中,CmR+Amp(pET15b)或者CmR+Kana(pET28a)抗性37℃,200rpm培养过夜,转入含有1L LB培养基的2L摇瓶中,37℃,200rpm,培养到OD600达到0.6-0.8时,降温到18℃,0.5mM IPTG诱导表达过夜,4000g离心收菌。
b)将收集好的菌体利用Ni-buffer A:50mM HEPES pH7.4,500mM NaCl,20mM咪唑,5mMβ-巯基乙醇重悬,加入终浓度为1mM PMSF和250ul Cocktail inhibitor,混匀。
c)重悬后的菌体经超声破碎仪破碎后,40000g,4℃离心30分钟,取上清过Ni-NTA柱。
d)Ni-NTA柱纯化,将裂解液上清与resin结合20分钟后,用含有50mM咪唑的bufferA洗杂,最后用含400mM咪唑的洗脱缓冲液洗脱。
e)SDS-PAGE凝胶电泳检测蛋白纯化效果。
f)透析换buffer至50mM HEPES pH7.5,150mM KCl,1mM DTT,3%甘油。
h)最终样品经SDS-PAGE凝胶电泳检测蛋白纯化效果,超滤浓缩后,冻存于-80℃备用。
2.3Cas9融合蛋白表达纯化结果
SpCas9和NGA-Cas9蛋白纯化结果如图12所示,箭头所指为Cas9蛋白条带,达到较高的纯度。
实施例7SpCas9和NGA Cas9蛋白分别对OsACCase2 W2038和OsALS W548靶向位点的体外酶切活性检测
1.将OsALS和OsACCase2基因DNA序列输入CRISPOR在线工具中(http://crispor.tefor.net/)针对OsALS对应拟南芥ALS蛋白第574位氨基酸位点的W548(OsALS第548位氨基酸,水稻ALS蛋白氨基酸序列如SEQ ID NO:11所示)和OsACCase2对应大穗看麦娘第2027位氨基酸位点的W2038(OsACCase2第2038位氨基酸,水稻ACCase2蛋白氨基酸序列如SEQ ID NO:13所示)分别设计sgRNA如下,委托金斯瑞公司合成:
>sgRNA1-548-G:
5’GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’
>sgRNA1-2038-G:
5’GUUCAUCCUCGCUAACUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’
2.利用特异检测引物OsALS265AA-F:5’ggtcttgcgtctggttggc3’和OsALS-end-R:5’ccatgccaagcacatcaaacaag 3’扩增含有OsALS W548靶位点的片段,PCR产物长度为1200bp。
利用特异检测引物OsACC1750AA-F:5’gcgaagaagactatgctcgtattgg3’和OsACC2196AA-R:5’cttaatcacacctttcgcagcc3’,扩增含有OsACCase W2038靶位点的片段,PCR产物长度为1500bp。
PCR体系如下表:
3.建立PCR反应,反应条件为:
4.琼脂糖凝胶电泳检测PCR产物并送测序进一步验证,验证无误后切胶回收DNA片段,加入30ul RNase-free超纯水进行溶解,并测试浓度。
5.使用以下检测体系检测Cas9蛋白活性,体系添加完成后,37℃条件下孵育1h。
6.反应完毕后,65℃处理10分钟,加入4ul 6×DNA上样缓冲液,使用浓度为2%的琼脂糖凝胶检测条带大小。
结果如图13所示,可见纯化的Cas9蛋白仅在加入sgRNA的条件下能够在设计的靶向位点处切割DNA双链。
实施例8利用两种不同靶向的RNP复合体转化水稻原生质体实现OsALS548位点的W548L突变
1.水稻原生质体制备以及PEG介导的转化在已经发表的方法(Bart et al.,2006)基础上进行了部分修改,具体的制备步骤如下:
(1)首先准备原生质体用的水稻幼苗,品种为日本晴(Nipponbare)。水稻种子首先去壳,去壳种子用75%乙醇漂洗1分钟,用5%(v/v)的次氯酸钠处理20分钟,然后用无菌水洗涤5次以上,放在超净台中吹干后放在盛有1/2MS的培养基的组培瓶中,每瓶放20粒种子。26℃,12小时光照培养10天左右取出制备原生质体。
(2)选取幼苗叶鞘部分,用锋利的吉利剃须刀片切成约1毫米的碎片,放在0.6M甘露醇和MES培养液(配方:0.6M甘露醇,0.4M MES,pH 5.7)中备用。将全部材料切好后转入20mL酶解液(配方:1.5%纤维素酶R10/RS(YaKult Honsha),0.5%Mecerozyme R10(YaKultHonsha),0.5M甘露醇,20mM KCl,20mM MES,pH5.7,10mM CaCl2,0.1%BSA,5mMβ-巯基乙醇)中,用锡箔纸包好置于28℃摇床中,50rpm避光酶解约4小时,最后2分钟将转速提高至100rpm;
(3)酶解结束后,加入等体积的W5溶液(配方:154mM NaCl,125mM CaCl2,5mM KCl,15mM MES),水平摇动10秒,释放原生质体。酶解后的细胞经300目的筛子过滤后,150g离心5分钟收集原生质体;
(4)用W5溶液漂洗细胞两次,150g离心5分钟收集原生质体;
(5)用适量的MMG溶液(配方:3.05g/L MgCl2,1g/L MES,91.2g/L甘露醇)重悬原生质体,原生质体浓度约为2×106个细胞/mL。
2.RNP复合体制备:
根据OsALS548靶位点序列GGGTATGGTTGTGCAATGGGAgga,带下划线为对应拟南芥ALS W574的OsALS W548位点,斜体小写为Cas9蛋白识别的PAM位点,选择纯化的NGA-Cas9蛋白制备RNP复合体。以GGA为PAM设计>CrRNA1-548-G:5’-GGGUAUGGUUGUGCAAUGGGAguuuuagagcuaugcu-3’,预测经过编辑后在PAM前3-4位之间会删除一个碱基G,然后以删除后的序列设计第二个>CrRNA2-548+T:5’-UGGGUAUGGUUGUGCAAUGGAguuuuagagcuaugcu-3’,预测经过第二次编辑会插入一个碱基T,从而实现TGG-TTG的转换。
将>CrRNA1-548-G,>CrRNA1-548+T交金斯瑞生物科技公司合成,同时还合成了sgRNA:
>sgRNA1-548-G:
5’GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’
>sgRNA2-548+T:
5’UGGGUAUGGUUGUGCAAUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’。
将合成的crRNA与GenCRISPR tracrRNA(金斯瑞SC1933)等摩尔混合,加入crRNA&tracrRNA退火buffer(金斯瑞SC1957-B)按操作说明退火制备gRNA。tracrRNA序列为5'-agcauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuu-3'。
按下表制备RNP反应体系,添加完成后,25℃孵育10分钟。
3.原生质体转化
(1)取上述200μl MMG重悬的原生质体加入孵育完成后的RNP复合体(Cas9蛋白20μg,sgRNA 20μg),轻弹混匀。
(2)加入等体积的40%(w/v)的PEG溶液(配方:40%(w/v)PEG,0.5M甘露醇,100mMCaCl2),轻弹混匀,28℃避光静置15分钟;
(3)诱导转化结束后缓慢加1.5mL的W5溶液,轻弹混匀细胞,150g离心3分钟收集细胞,重复此步骤一次;
(4)加入1.5mL W5溶液重悬细胞,置于28℃培养箱中避光培养12-16小时,若用于提取原生质体基因组DNA,需培养48-60小时。
4.基因组靶点编辑事件检测
(1)提取原生质体DNA,使用CTAB法并进行部分修改,具体方法如下:原生质体离心后弃上清,加入500μL DNA提取液,振荡混匀,置于65℃水浴锅中孵育1小时;水浴后的样品冷却后加入等体积的氯仿,颠倒混匀后10,000rpm离心10分钟;取400μl上清转移到一个新的1.5mL离心管中,加入1mL 70%(v/v)的乙醇放入-20℃沉淀20分钟;用12,000rpm离心15分钟沉淀DNA,待沉淀晾干后加入50μl超纯水溶解,保存于-20℃备用。
(2)使用基因特异引物,扩增含有W548靶位点的片段,针对靶点设计了检测引物:OsALS500AA-F:5’GGCTAACCCAGGTGTCACAG3’,OsALS-3’UTR-R:5’CCATGCCAAG-CACATCAAACAAG3’
PCR反应体系如下表:
(3)建立PCR反应,一般反应条件是:
(4)琼脂糖凝胶电泳检测,回收PCR片段测序。
5.检测结果:
使用合成的crRNA和tracrRNA退火制备的gRNA或直接使用合成的sgRNA与纯化的NGA-Cas9蛋白均能形成有活性的RNP复合体,对OsALS548靶向位点测序能够检测到TGG到TTG的突变,证明RNP复合体配合前后顺序的crRNA或sgRNA能够在细胞内实现对目标位点的定向突变。如图14所示,原生质体OsALS548靶点测序峰图中箭头所指处除原始的G碱基信号峰外,还有突变得到的T碱基信号峰,导致了OsALS548位点处W548L突变。
实施例9:利用两种不同靶向的RNP复合体轰击水稻愈伤实现OsACCase2 W2038位点的W2038L突变
1.RNP复合体制备:
根据OsACCase2 W2038靶位点序列GTTCATCCTCGCTAACTGGAGagg,带下划线为对应大穗看麦娘ACCase W2027的OsACCase2 W2038位点,斜体小写为Cas9蛋白识别的PAM位点,选择纯化的SpCas9蛋白制备RNP复合体。以GGA为PAM设计>CrRNA1-2038-G:5’-GUUCAUCCUCGCUAACUGGAGguuuuagagcuaugcu-3’,预测经过编辑后在PAM前3-4位之间会删除一个碱基G,然后以删除后的序列设计第二个>CrRNA2-2038+T:5’-UGUUCAUCCUCGCUAACUGAGguuuuagagcuaugcu-3’,预测经过第二次编辑会插入一个碱基T,从而实现TGG-TTG的转换。
将>CrRNA1-2038-G,>CrRNA2-2038+T交金斯瑞生物科技公司合成,同时还合成了sgRNA:
>sgRNA1-2038-G:
5’GUUCAUCCUCGCUAACUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc 3’
>sgRNA2-2038+T:
5’UGUUCAUCCUCGCUAACUGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc 3’。
将合成的crRNA与GenCRISPR tracrRNA(金斯瑞SC1933)等摩尔混合,加入crRNA&tracrRNA退火buffer(金斯瑞SC1957-B)按操作说明退火制备gRNA。
按实施例8同样的反应体系孵育制备RNP复合体,以基因枪转化10次轰击用量为例:Cas9蛋白20μg,gRNA或sgRNA 20μg,10μl 10×Cas9反应缓冲液,使用RNase-free超纯水补足,共100μl,25℃孵化10分钟,轻混匀。
2.水稻愈伤诱导
挑选成熟饱满的水稻种子,脱壳,按以下步骤消毒处理:
(1)剥取水稻种子,水稻品种为淮稻5号,来自种子市场采购。
(2)无菌水清洗种子,直至洗后的水变清澈,不限次数。
(3)70%酒精消毒1分钟,之后10%次氯酸钠置于水平摇床摇晃培养25分钟。
(4)次氯酸钠消毒后无菌水清洗5次。接种于愈伤诱导培养基(配方:MS粉末(4.42g/L)+2,4-D(2mg/L)+蔗糖(30g/L)+植物凝胶(4g/L)),28℃黑暗培养诱导愈伤。
3.基因枪RNP轰击:
(1)高渗培养
将胚性良好的愈伤组织转移至高渗培养基(配方:MS粉末(4.42g/L)+2,4-D(2mg/L)+蔗糖(30g/L)+D-甘露醇(0.4M)+植物凝胶(4g/L)),超净台无菌操作,25℃,暗培养4-6小时。
(2)制备金粉悬浮液:用1.5mL的进口EP管,称取30mg金粉(直径0.6μm);加入1mL70%的乙醇,充分涡旋,冰上静置10分钟。离心1分钟,弃上清;加入1mL无菌水,充分涡旋,离心1分钟,弃上清,重复操作3次。加入500μL灭菌甘油(50%),充分涡旋,制成浓度为60μg/μl的金粉悬浮液,-20℃保存。
(3)取50μl金粉悬浮液(60μg/ml),加入制备好的RNP复合体100μL,温和混匀。
(4)取15μl RNP金粉混合液于PDS-1000台式基因枪(Bio-Rad)可裂膜中心,吹干后,按照仪器操作说明进行轰击。
轰击参数:真空度为26-28,距离为6厘米,气压为1100psi或1350psi。
(5)轰击完成后愈伤在高渗培养基上25℃黑暗过夜培养16小时。
4.筛选、分化和生根:
(1)轰击后的愈伤过夜培养后,转入诱导培养基,28℃恢复培养一周。
(2)恢复1周后,愈伤转入筛选培养基(配方:4.1g/L N6粉末+0.3g/L水解酪蛋白+2.8g/L脯氨酸+2mg/L 2,4-D+3%蔗糖+50ug/L精喹禾灵+500mg/L Cef(头孢霉素)+0.1g/L肌醇+0.35%植物凝胶,pH 5.8)筛选3-4周,对OsACCase2 W2038的预期编辑,使用精喹禾灵50ug/L进行筛选,如图15所示。
(3)筛选出的生长状态良好的抗性愈伤转入分化培养基(配方:MS粉末(4.42g/L)+KT(1mg/L)+蔗糖(30g/L)+植物凝胶(4.5g/L)+50ug/L精喹禾灵,pH 5.8),28℃光照培养诱导分化2-4周。
(4)将分化出的幼苗移至生根培养基(配方:1/2MS粉末(2.3g/L)+蔗糖(30g/L)+植物凝胶(4.5g/L))进行生根培养,生根完成的幼苗进行炼苗处理后,移至装有土壤的花盆中置温室进行培养。
5.抗性愈伤和T0组培苗的靶点编辑事件检测:
在筛选阶段共得到11个抗性愈伤,使用CTAB法提取DNA,针对靶点设计检测引物为OsACC2038test-F:5’CTGTAGGCATTTGAAACTGCAGTG3’,OsACC2038test-R:5’GCAATCCTGGAGTTCCT-CTGACC3’,扩增包含OsACCase2 W2038位点的PCR片段,回收测序。测序检测其中10个在OsACCase2 W2038位点存在TGG到TTG的突变,其中3个样品为纯合突变。
对抗性愈伤分化得到的T0代组培苗提取DNA检测编辑靶点序列,同样在OsACCase2W2038位点存在TGG到TTG的纯合突变,如图16所示。
6.T1代苗对ACCase抑制剂类除草剂的抗性测试
检测发生W2038L突变的T0株系扩繁后,对T1代突变幼苗使用田间浓度精喹禾灵和高效氟吡甲禾灵测试除草剂抗性,可见OsACCase2 W2038L突变株系对这2种ACCase抑制剂类除草剂均产生明显抗性,如图17-18所示。
综上,使用合成的crRNA和tracrRNA退火制备的gRNA或直接使用合成的sgRNA与纯化的SpCas9蛋白均能形成有活性的RNP复合体,能够在组培阶段使用精喹禾灵对基因枪轰击的愈伤进行筛选,对T0代组培苗的OsACCase2 W2038靶向位点测序能够检测到TGG到TTG的纯合突变,该突变能够遗传到T1代并表现出ACCase抑制剂类除草剂的抗性,进一步证明RNP复合体配合前后顺序的crRNA或sgRNA连续打靶能够在细胞内实现对目标位点的定向突变,并能引导产生细胞内源的筛选标记用于组培筛选,创制抗除草剂的作物。
实施例10:利用不同靶向的RNP复合体编辑水稻愈伤OsACCase2 W2038位点同时编辑OsBADH2基因
RNP复合体制备方法参照实施例8,基因枪轰击和组培步骤同实施例9,除针对OsACCase2 W2038位点的crRNA或sgRNA外,同时加入针对OsBADH2基因的crRNA或sgRNA,与SpCas9蛋白孵育形成针对第二靶标基因OsBADH2的靶向RNP复合体,进行基因枪轰击,恢复培养,筛选,分化,生根,得到T0代组培苗,扩繁T1代。
水稻OsBADH2基因组序列如SEQ ID NO:17所示,根据CRISPOR在线工具(http://crispor.tefor.net/)选择靶位点序列CCAAGTACCTCCGCGCAATCGcgg,斜体小写为Cas9蛋白识别的PAM位点,选择纯化的SpCas9蛋白制备RNP复合体。以CGG为PAM设计>CrRNA1-OsBADH2:5’-CCAAGUACCUCCGCGCAAUCGguuuuagagcuaugcu-3’,预测通过精喹禾灵筛选得到的抗性愈伤中能够同时检测到OsACCase2 W2038L的抗性突变和OsBADH2的敲除突变事件。
将>CrRNA1-OsBADH2交金斯瑞生物科技公司合成,同时还合成了sgRNA:
>OsBADH2-sgRNA:5’CCAAGUACCUCCGCGCAAUCGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’。
按实施例9中的转化步骤筛选抗性愈伤,如图19所示,挑选抗性愈伤分化出苗,对愈伤和T0代组培苗OsACCase2和OsBADH2靶点处序列进行测序,OsBADH2靶点检测引物为:
OsBADH2-check F:5’CATCGGTACCCTCCTCTTC3’
OsBADH2-check R:5’ATCGATCGATTTGGGGCTCA3’
结果共筛选得到13个抗性愈伤,其中11个检测到OsACCase2 W2038L突变事件,在这11个愈伤样品中检测OsBADH2靶点序列,其中8个同时含有OsBADH2靶点处的编辑事件。在分化得到的T0代组培苗中,能够检测到存在OsACCase2 W2038L的突变和OsBADH2+A的纯合突变,如图20-21所示。
综上所述,使用顺序打靶的crRNA或sgRNA靶向RNP复合体对OsACCase2 W2038进行定向编辑,同时加入靶向第二靶标基因OsBADH2的靶向RNP复合体,对水稻愈伤进行基因枪轰击后,能够在组培阶段使用精喹禾灵对愈伤进行筛选,抗性愈伤中61%同时发生了OsACCase2 W2038突变和OsBADH2的靶向敲除,在T0代组培苗中可见检测到OsBADH2发生纯合突变的株系,说明顺序打靶结合RNP转化针对抗性基因的定点编辑可以产生内源的筛选标记,加入对应的筛选压力可以同时筛选第二靶标基因的编辑事件,实现非转基因手段的基因组定点编辑。
实施例11:利用不同靶向的RNP复合体编辑水稻愈伤OsALS548位点同时编辑OsSWEET14基因
针对OsALS548位点的靶向RNP复合体制备方法参照实施例8,crRNA和sgRNA序列同实施例8,分别为:
>CrRNA1-548-G:5’-GGGUAUGGUUGUGCAAUGGGAguuuuagagcuaugcu-3’,
>CrRNA2-548+T:5’-UGGGUAUGGUUGUGCAAUGGAguuuuagagcuaugcu-3’,
>sgRNA1-548-G:
5’GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’,
>sgRNA2-548+T:
5’UGGGUAUGGUUGUGCAAUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’。
参照实施例8,将gRNA或sgRNA与NGA-Cas9孵育制备靶向OsALS548位点的RNP复合体。
除针对OsALS548位点的靶向RNP复合体外,同时加入针对OsSWEET14基因的crRNA或sgRNA,与SpCas9蛋白孵育形成针对第二靶标基因OsSWEET14的靶向RNP复合体,进行基因枪轰击,恢复培养,筛选,分化,生根,得到T0代组培苗,扩繁T1代。筛选压力选用5mg/L啶磺草胺。
水稻OsSWEET14基因组序列如SEQ ID NO:18所示,根据CRISPOR在线工具(http://crispor.tefor.net/)选择靶位点序列GAGCTTAGCACCTGGTTGGAGggg,斜体小写为SpCas9蛋白识别的PAM位点,选择纯化的SpCas9蛋白制备RNP复合体。以GGG为PAM设计:
>CrRNA1-OsSWEET14:
5’-GAGCUUAGCACCUGGUUGGAGguuuuagagcuaugcu-3’,预测通过啶磺草胺筛选得到的抗性愈伤中能够同时检测到OsALS W548L的抗性突变和OsSWEET14的敲除突变事件。
将>CrRNA1-Os SWEET14交金斯瑞生物科技公司合成,同时还合成了sgRNA:
>Os SWEET14-sgRNA:
5’GAGCUUAGCACCUGGUUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’。
按实施例9所述基因枪轰击和组培步骤筛选抗性愈伤,如图22所示,挑选抗性愈伤分化出苗,其中筛选培养基配方为:4.1g/L N6粉末+0.3g/L水解酪蛋白+2.8g/L脯氨酸+2mg/L 2,4-D+3%蔗糖+5mg/L啶黄草胺+500mg/LCef(头孢霉素)+0.1g/L肌醇+0.35%植物凝胶,pH 5.8。
对愈伤和T0代组培苗OsALS548位点和OsSWEET14靶点处序列进行测序,OsSWEET14靶点检测引物为:
OsSWEET14-check F:5’ATGGGTGCTGATGATTATCTTGTAT3’
OsSWEET14-check R:5’TGAAGAGACATGCCAGCCATTG3’
结果共筛选得到9个抗性愈伤,其中8个检测到OsALS W548L突变事件,在这8个愈伤样品中检测OsSWEET14靶点序列,其中5个同时含有OsSWEET14靶点处的编辑事件。在分化得到的T0代组培苗中,能够检测到同时存在OsALS W548L的突变和OsSWEET14-C的纯合突变,如图23-24所示。
检测发生OsALS W548L突变的T0株系扩繁后,对T1代突变幼苗株系使用田间浓度的啶磺草胺、甲基咪草烟、烟嘧磺隆和氟唑磺隆测试除草剂抗性,可见OsALS W548L突变株系对这4种ALS抑制剂类除草剂均产生明显抗性,如图25-28所示。
综上所述,使用合成的crRNA和tracrRNA退火制备的gRNA或直接使用合成的sgRNA与纯化的NGA Cas9蛋白均能形成有活性的RNP复合体,配合顺序打靶的crRNA或sgRNA能够在细胞内实现对目标位点的定向突变,能够在组培阶段使用啶磺草胺对基因枪轰击的愈伤进行筛选,对T0代组培苗的OsALS548靶向位点测序能够检测到TGG到TTG的突变,该突变能够遗传到T1代并表现出对ALS抑制剂类除草剂的抗性。
同时加入靶向第二靶标基因OsSWEET14的靶向RNP复合体,使用识别NGG PAM的SpCas9蛋白,对水稻愈伤进行基因枪轰击后,在组培阶段使用啶磺草胺对愈伤进行筛选,抗性愈伤中55%同时发生了OsALS W548L突变和OsSWEET14的靶向敲除,在T0代组培苗中可检测到OsSWEET14发生纯合突变的株系,进一步说明顺序打靶结合RNP转化针对抗性基因的定点编辑可以产生内源的筛选标记,并且可以同时使用识别不同PAM位点的Cas9蛋白,加入对应的筛选压力同时筛选第二靶标基因的编辑事件,实现非转基因手段的基因组定点编辑。
实施例12:利用两种不同靶向的RNP复合体轰击马铃薯外植体实现StALS561位点的W561L突变
马铃薯StALS2蛋白氨基酸序列如SEQ ID NO:19所示,马铃薯StALS2基因序列如SEQ ID NO:20所示。RNP复合体制备和基因枪轰击方法参照实施例8-9,针对马铃薯StALS2对应拟南芥ALS574位点的StALS2W561位点设计针对原始序列和编辑后序列的sgRNA如下:
>StALS561-G:
5’GGGAAUGGUGGUUCAGUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’
>StALS561+T:
5’UGGGAAUGGUGGUUCAGUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3’,
按实施例8所述方法制备RNP复合体。
受体马铃薯品种为大西洋或费瑞乌它,分别使用了叶片、茎段和腋芽作为外植体,基因枪轰击和筛选分化方法如下:
(1)叶片:将整叶剪下,平铺在高渗M6培养基(配方:4.42g/L MS粉末+1ml/L B5vitamins(Phytotechlab,G219)+30g/L蔗糖+8g/L琼脂+2mg/L 2,4-D+0.8mg/L玉米素核苷+0.2M甘露醇+250mg/L Cef)中,每一枪大约5-6片叶。预培养24小时后,进行金粉轰击。轰击后继续高渗M6培养基暗培养2天,转移至M6培养基(4.42g/L MS粉末+1ml/L B5vitamins(Phytotechlab,G219)+30g/L蔗糖+8g/L琼脂+2mg/L 2,4-D+0.8mg/L玉米素核苷+250mg/LCef)中,继续培养1周,1周后转移至带有筛选压力的M6培养基,筛选压力为20μg/L氯磺隆(配方:4.42g/L MS粉末+1ml/L B5 vitamins(Phytotechlab,G219)+30g/L蔗糖+8g/L琼脂+2mg/L2,4-D+0.8mg/L玉米素核苷+250mg/L Cef+20μg/L氯磺隆)中进行筛选抗性愈伤,4周后转移至含有筛选压力的诱导芽培养基R4(配方:4.42g/L MS粉末+1ml/L B5vitamins(Phytotechlab,G219)+30g/L蔗糖+8g/L琼脂+2mg/L GA3+0.8mg/L玉米素核苷+250mg/LCef+20μg/L氯磺隆),直至出苗。
(2)茎段:取马铃薯茎段(不含腋芽),将茎段纵切,切口朝上,放置于CIMI培养基(4.42g/L MS粉末+20g/L蔗糖+8g/L琼脂+0.5mg/L玉米素核苷+2mg/L 2,4-D+250mg/L Cef+20μg/L氯磺隆)上,随后进行基因枪轰击,轰击后暗培养1天,将茎段转移至新鲜的CIMI培养基上,继续培养1周,随后将茎段转移至含有筛选压力的SIMI培养基(配方:4.42g/L MS粉末+20g/L蔗糖+8g/L琼脂+1mg/L玉米素核苷+0.1mg/L GA3+250mg/L Cef+20μg/L氯磺隆)上进行抗性芽的筛选,直至出苗。
(3)腋芽:取马铃薯茎段上的腋芽,进行纵切后转移至CIMI培养基上,切口朝上,放置于CIMI培养基上,随后进行基因枪轰击,轰击后暗培养1天,将茎段转移至新鲜的CIMI培养基上,继续培养1周,随后将茎段转移至含有筛选压力的SIMI培养基上进行抗性芽的筛选,直至出苗。
对StALS2 W561位点的检测引物为:
StALS561-Check F:5’GTGGATTAGGAGCAATGGGATTT3’
StALS561-Check R:5’TTATTTTAGATAATACAATGCCTCG3’
经检测,经抗性筛选的T0代马铃薯组培苗StALS2 W561位点发生了W561L的编辑事件,说明本发明提供的非转基因瞬时基因编辑方法适用于类似马铃薯这类难以通过自交或杂交分离去除外源转基因元件的作物。
实施例13:循环打靶方案成功地在人类293T细胞中进行了碱基替换
选择人胚肾细胞293T中HBB(hemoglobin subunit beta)基因(其DNA序列如SEQID NO:21所示,其CDS序列如SEQ ID NO:22所示,其氨基酸序列如SEQ ID NO:23所示),第一个外显子的区域设计sgRNA的连续打靶的靶位点,其中第一靶点catggtgcaCctgactcctgAGG,识别此靶点的sgRNA命名为sgHBB,预测此位点sgRNA切口处有可能产生减少一个C碱基。第二靶点为ccatggtgcatctgactctgAGG,识别第一靶点打靶后产生的减少一个C碱基的序列,此靶点的sgRNA命名为sgHBB-c。并设计在293T细胞中无靶位点的sgRNA命名为sgNOTAR,作为实验中转染补齐质粒。
根据以上设计,分别合成互补单链DNA片段。经过退火后连接入BbsI酶酶切的px458(addgene:48138)质粒中。并转化大肠杆菌DH5a感受态。获得的大肠杆菌单克隆经过测序验证正确后,用无内毒素质粒提取试剂盒(天根生物)提取纯化质粒。
用0.05%胰蛋白酶(Gibico)消化分离生长旺盛的293T细胞。用DMEM培养基(10%胎牛血清;青霉素+链霉素双抗)稀释后接种至24孔培养板。置于二氧化碳培养箱中培养过夜。次日,按照连续打靶:sgHBB和sgHBB-c质粒各0.5ug;单靶点打靶:sgHBB和sgNOTAR质粒各0.5ug;无靶点对照:pEGFP-c1质粒1ug分别混合。用lipofectamine3000(Invitrogen)进行转化。每组设3个重复。
转化后48小时,用荧光显微镜拍照记录转化效率。并用核酸提取试剂盒(Omega)分别提取各孔细胞总DNA。
设计Hi-tom测序引物如下:
Hi-HBB-F:ggagtgagtacggtgtgcGCTTACATTTGCTTCTGACACAACT;
Hi-HBB-R:gagttggatgctggatggTCTATTGGTCTCCTTAAACCTGTCTTG。
并用此引物对各个DNA样本进行PCR。PCR产物用Hi-tom方法高通量测序(SciChina Life Sci.2019Jan;62(1):1-7.doi:10.1007/s11427-018-9402-9)。
测序结果的统计数据显示在表6和表7中,这些数据表明:HBB位点连续打靶方法产生了约1.67%的C到T的编辑结果(导致P6S突变),而单靶点打靶无法产生此类碱基替换突变。
表6在293T细胞中HBB基因连续打靶实验不同sgRNA组合产生的编辑类型,以Hi-Tom方式测序检测到的不同基因型的读数
表7合并统计在293T细胞中HBB基因连续打靶实验不同sgRNA组合产生的编辑类型各自所占的比例
注:WT代表野生型;Deletion代表删除的基因型;Insertion代表插入的基因型;C->T SNP代表在切口处产生C到T的碱基替换的基因型;total代表总计。
此外,镰刀细胞贫血症(sickle cell anemia)和β-地中海贫血(β-thalassemia)都是由于编码成人血红蛋白β亚基的HBB基因上出现突变而导致的遗传性贫血症。这些疾病的患者可能终生需要接受输血或者其它疗法的治疗。上述实验的结果表明,通过本发明提供的循环打靶的技术方案,可以对HBB基因的突变位点设计crRNA或sgRNA组合诱导在突变位点产生预期的修复,使细胞产生有活性的血红蛋白,恢复功能,起到治疗作用,即本发明提供的组合物具有治疗疾病的用途。
同时经过多种测试,由于这种新方法完全是建立在Cas9已有功能的基础之上,因此在其他Cas9能够很好起作用的生物体中(植物、动物、真菌或细菌等),本发明的方法将完全适用,实现碱基替换、删除和插入特定的片段的新功能。
说明书中提及的所有出版物和专利申请均通过引用并入本文,如同每篇出版物或专利申请被单独、特别地通过引用并入本文一样。
尽管为清楚理解起见,前述发明已通过举例说明和实施例的方式较为详细地进行了描述,但显而易见的是,可以在所附权利要求书的范围内实施某些改变和修改,这样的改变和修改均在本发明的范围之内。
序列表
<110> 青岛清原化合物有限公司
<120> 一种在生物体内产生新突变的方法及应用
<130> 2020
<150> 201911081617X
<151> 2019-11-07
<150> 2020108218772
<151> 2020-08-15
<150> 2020109741512
<151> 2020-09-16
<160> 23
<170> SIPOSequenceListing 1.0
<210> 1
<211> 670
<212> PRT
<213> 拟南芥ALS蛋白氨基酸序列(氨基酸序列)
<400> 1
Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe
1 5 10 15
Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser
20 25 30
Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser
35 40 45
Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser Pro Ser Ser Ile Ser Ala
50 55 60
Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys
65 70 75 80
Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro
85 90 95
Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val
100 105 110
Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln
115 120 125
Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu
130 135 140
Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys
145 150 155 160
Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val
165 170 175
Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile
180 185 190
Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu
195 200 205
Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu
210 215 220
Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe
225 230 235 240
Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys
245 250 255
Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg
260 265 270
Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His
275 280 285
Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu
290 295 300
Tyr Val Gly Gly Gly Cys Leu Asn Ser Ser Asp Glu Leu Gly Arg Phe
305 310 315 320
Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly
325 330 335
Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His
340 345 350
Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu
355 360 365
Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala
370 375 380
Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu
385 390 395 400
Ile Gly Lys Asn Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys
405 410 415
Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu
420 425 430
Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys
435 440 445
Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro
450 455 460
Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile
465 470 475 480
Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr
485 490 495
Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala
500 505 510
Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro
515 520 525
Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn
530 535 540
Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val
545 550 555 560
Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp
565 570 575
Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Phe Leu Gly Asp Pro Ala
580 585 590
Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys
595 600 605
Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala
610 615 620
Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile
625 630 635 640
Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser Gly Gly Thr
645 650 655
Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr
660 665 670
<210> 2
<211> 2013
<212> DNA
<213> 拟南芥ALS基因DNA序列(DNA序列)
<400> 2
atggcggcgg caacaacaac aacaacaaca tcttcttcga tctccttctc caccaaacca 60
tctccttcct cctccaaatc accattacca atctccagat tctccctccc attctcccta 120
aaccccaaca aatcatcctc ctcctcccgc cgccgcggta tcaaatccag ctctccctcc 180
tccatctccg ccgtgctcaa cacaaccacc aatgtcacaa ccactccctc tccaaccaaa 240
cctaccaaac ccgaaacatt catctcccga ttcgctccag atcaaccccg caaaggcgct 300
gatatcctcg tcgaagcttt agaacgtcaa ggcgtagaaa ccgtattcgc ttaccctgga 360
ggtgcatcaa tggagattca ccaagcctta acccgctctt cctcaatccg taacgtcctt 420
cctcgtcacg aacaaggagg tgtattcgca gcagaaggat acgctcgatc ctcaggtaaa 480
ccaggtatct gtatagccac ttcaggtccc ggagctacaa atctcgttag cggattagcc 540
gatgcgttgt tagatagtgt tcctcttgta gcaatcacag gacaagtccc tcgtcgtatg 600
attggtacag atgcgtttca agagactccg attgttgagg taacgcgttc gattacgaag 660
cataactatc ttgtgatgga tgttgaagat atccctagga ttattgagga agctttcttt 720
ttagctactt ctggtagacc tggacctgtt ttggttgatg ttcctaaaga tattcaacaa 780
cagcttgcga ttcctaattg ggaacaggct atgagattac ctggttatat gtctaggatg 840
cctaaacctc cggaagattc tcatttggag cagattgtta ggttgatttc tgagtctaag 900
aagcctgtgt tgtatgttgg tggtggttgt ttgaattcta gcgatgaatt gggtaggttt 960
gttgagctta cggggatccc tgttgcgagt acgttgatgg ggctgggatc ttatccttgt 1020
gatgatgagt tgtcgttaca tatgcttgga atgcatggga ctgtgtatgc aaattacgct 1080
gtggagcata gtgatttgtt gttggcgttt ggggtaaggt ttgatgatcg tgtcacgggt 1140
aagcttgagg cttttgctag tagggctaag attgttcata ttgatattga ctcggctgag 1200
attgggaaga ataagactcc tcatgtgtct gtgtgtggtg atgttaagct ggctttgcaa 1260
gggatgaata aggttcttga gaaccgagcg gaggagctta agcttgattt tggagtttgg 1320
aggaatgagt tgaacgtaca gaaacagaag tttccgttga gctttaagac gtttggggaa 1380
gctattcctc cacagtatgc gattaaggtc cttgatgagt tgactgatgg aaaagccata 1440
ataagtactg gtgtcgggca acatcaaatg tgggcggcgc agttctacaa ttacaagaaa 1500
ccaaggcagt ggctatcatc aggaggcctt ggagctatgg gatttggact tcctgctgcg 1560
attggagcgt ctgttgctaa ccctgatgcg atagttgtgg atattgacgg agatggaagc 1620
tttataatga atgtgcaaga gctagccact attcgtgtag agaatcttcc agtgaaggta 1680
cttttattaa acaaccagca tcttggcatg gttatgcaat gggaagatcg gttctacaaa 1740
gctaaccgag ctcacacatt tctcggggat ccggctcagg aggacgagat attcccgaac 1800
atgttgctgt ttgcagcagc ttgcgggatt ccagcggcga gggtgacaaa gaaagcagat 1860
ctccgagaag ctattcagac aatgctggat acaccaggac cttacctgtt ggatgtgatt 1920
tgtccgcacc aagaacatgt gttgccgatg atcccgagtg gtggcacttt caacgatgtc 1980
ataacggaag gagatggccg gattaaatac tga 2013
<210> 3
<211> 2320
<212> PRT
<213> 大穗看麦娘ACCase蛋白氨基酸序列(氨基酸序列)
<400> 3
Met Gly Ser Thr His Leu Pro Ile Val Gly Phe Asn Ala Ser Thr Thr
1 5 10 15
Pro Ser Leu Ser Thr Leu Arg Gln Ile Asn Ser Ala Ala Ala Ala Phe
20 25 30
Gln Ser Ser Ser Pro Ser Arg Ser Ser Lys Lys Lys Ser Arg Arg Val
35 40 45
Lys Ser Ile Arg Asp Asp Gly Asp Gly Ser Val Pro Asp Pro Ala Gly
50 55 60
His Gly Gln Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro
65 70 75 80
Lys Glu Gly Ala Ser Ala Pro Asp Val Asp Ile Ser His Gly Ser Glu
85 90 95
Asp His Lys Ala Ser Tyr Gln Met Asn Gly Ile Leu Asn Glu Ser His
100 105 110
Asn Gly Arg His Ala Ser Leu Ser Lys Val Tyr Glu Phe Cys Thr Glu
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Met Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met Asn Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Ile Pro Leu Glu Leu
275 280 285
Cys Leu Asp Ser Ile Pro Glu Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Ala Asp Glu Ala Val Ala Ser Cys Gln Met Ile Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
Asn Asn Asp Asp Glu Val Lys Ala Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ser Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Glu Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Ser
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asp
485 490 495
Asn Gly Gly Gly Tyr Asp Ile Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Gln Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asn Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Gly Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Glu Thr Arg Ser Ala
580 585 590
Ala Ile Thr Ser Met Ser Leu Ala Leu Lys Glu Ile Gln Ile Arg Gly
595 600 605
Glu Ile His Thr Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Pro
610 615 620
Asp Phe Arg Glu Asn Thr Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Ile Thr Thr Asn Ala Glu Thr Val Ser
660 665 670
Glu Tyr Val Ser Tyr Leu Ile Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val His Ser Thr Ile Ser Leu Asn Ile Glu Glu Ser Lys Tyr
690 695 700
Thr Ile Glu Ile Val Arg Ser Gly Gln Gly Ser Tyr Arg Leu Arg Leu
705 710 715 720
Asn Gly Ser Leu Ile Glu Ala Asn Val Gln Thr Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Gly Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Leu Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Arg Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Ile Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ala Gly Val Ile Asn Val Leu Leu Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Gly Ser Phe Pro Glu Met Ser Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Arg Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Ala Arg Met Val Leu Ala Gly Tyr Asp His Ala Ala Asn Lys
885 890 895
Val Val Gln Asp Leu Val Trp Cys Leu Asp Thr Pro Ala Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Arg Leu Lys Ser Glu Leu Glu Gly Lys Tyr Asn Glu Tyr Lys Leu Asn
930 935 940
Val Asp His Val Lys Ile Lys Asp Phe Pro Thr Glu Met Leu Arg Glu
945 950 955 960
Thr Ile Glu Glu Asn Leu Ala Cys Val Ser Glu Lys Glu Met Val Thr
965 970 975
Ile Glu Arg Leu Val Asp Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Ile Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Ser Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser Asp
1010 1015 1020
Val Ile Glu Arg Leu Arg Leu Gln Tyr Ser Lys Asp Leu Gln Lys Val
1025 1030 1035 1040
Val Asp Ile Val Leu Ser His Gln Gly Val Arg Asn Lys Thr Lys Leu
1045 1050 1055
Ile Leu Ala Leu Met Glu Lys Leu Val Tyr Pro Asn Pro Ala Ala Tyr
1060 1065 1070
Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn His Lys Arg Tyr Tyr
1075 1080 1085
Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu Glu Gln Thr Lys Leu Ser
1090 1095 1100
Glu Leu Arg Thr Ser Ile Ala Arg Asn Leu Ser Ala Leu Asp Met Phe
1105 1110 1115 1120
Thr Glu Glu Lys Ala Asp Phe Ser Leu Gln Asp Arg Lys Leu Ala Ile
1125 1130 1135
Asn Glu Ser Met Gly Asp Leu Val Thr Ala Pro Leu Pro Val Glu Asp
1140 1145 1150
Ala Leu Val Ser Leu Phe Asp Cys Thr Asp Gln Thr Leu Gln Gln Arg
1155 1160 1165
Val Ile Gln Thr Tyr Ile Ser Arg Leu Tyr Gln Pro Gln Leu Val Lys
1170 1175 1180
Asp Ser Ile Gln Leu Lys Tyr Gln Asp Ser Gly Val Ile Ala Leu Trp
1185 1190 1195 1200
Glu Phe Thr Glu Gly Asn His Glu Lys Arg Leu Gly Ala Met Val Ile
1205 1210 1215
Leu Lys Ser Leu Glu Ser Val Ser Thr Ala Ile Gly Ala Ala Leu Lys
1220 1225 1230
Asp Ala Ser His Tyr Ala Ser Ser Ala Gly Asn Thr Val His Ile Ala
1235 1240 1245
Leu Leu Asp Ala Asp Thr Gln Leu Asn Thr Thr Glu Asp Ser Gly Asp
1250 1255 1260
Asn Asp Gln Ala Gln Asp Lys Met Asp Lys Leu Ser Phe Val Leu Lys
1265 1270 1275 1280
Gln Asp Val Val Met Ala Asp Leu Arg Ala Ala Asp Val Lys Val Val
1285 1290 1295
Ser Cys Ile Val Gln Arg Asp Gly Ala Ile Met Pro Met Arg Arg Thr
1300 1305 1310
Phe Leu Leu Ser Glu Glu Lys Leu Cys Tyr Glu Glu Glu Pro Ile Leu
1315 1320 1325
Arg His Val Glu Pro Pro Leu Ser Ala Leu Leu Glu Leu Asp Lys Leu
1330 1335 1340
Lys Val Lys Gly Tyr Asn Glu Met Lys Tyr Thr Pro Ser Arg Asp Arg
1345 1350 1355 1360
Gln Trp His Ile Tyr Thr Leu Arg Asn Thr Glu Asn Pro Lys Met Leu
1365 1370 1375
His Arg Val Phe Phe Arg Thr Leu Val Arg Gln Pro Ser Ala Gly Asn
1380 1385 1390
Arg Phe Thr Ser Asp His Ile Thr Asp Val Glu Val Gly His Ala Glu
1395 1400 1405
Glu Pro Leu Ser Phe Thr Ser Ser Ser Ile Leu Lys Ser Leu Lys Ile
1410 1415 1420
Ala Lys Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His Ser His
1425 1430 1435 1440
Met Tyr Leu Cys Ile Leu Lys Glu Gln Lys Leu Leu Asp Leu Val Pro
1445 1450 1455
Val Ser Gly Asn Thr Val Val Asp Val Gly Gln Asp Glu Ala Thr Ala
1460 1465 1470
Cys Ser Leu Leu Lys Glu Met Ala Leu Lys Ile His Glu Leu Val Gly
1475 1480 1485
Ala Arg Met His His Leu Ser Val Cys Gln Trp Glu Val Lys Leu Lys
1490 1495 1500
Leu Val Ser Asp Gly Pro Ala Ser Gly Ser Trp Arg Val Val Thr Thr
1505 1510 1515 1520
Asn Val Thr Gly His Thr Cys Thr Val Asp Ile Tyr Arg Glu Val Glu
1525 1530 1535
Asp Thr Glu Ser Gln Lys Leu Val Tyr His Ser Thr Ala Leu Ser Ser
1540 1545 1550
Gly Pro Leu His Gly Val Ala Leu Asn Thr Ser Tyr Gln Pro Leu Ser
1555 1560 1565
Val Ile Asp Leu Lys Arg Cys Ser Ala Arg Asn Asn Lys Thr Thr Tyr
1570 1575 1580
Cys Tyr Asp Phe Pro Leu Thr Phe Glu Ala Ala Val Gln Lys Ser Trp
1585 1590 1595 1600
Ser Asn Ile Ser Ser Glu Asn Asn Gln Cys Tyr Val Lys Ala Thr Glu
1605 1610 1615
Leu Val Phe Ala Glu Lys Asn Gly Ser Trp Gly Thr Pro Ile Ile Pro
1620 1625 1630
Met Gln Arg Ala Ala Gly Leu Asn Asp Ile Gly Met Val Ala Trp Ile
1635 1640 1645
Leu Asp Met Ser Thr Pro Glu Phe Pro Ser Gly Arg Gln Ile Ile Val
1650 1655 1660
Ile Ala Asn Asp Ile Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu
1665 1670 1675 1680
Asp Ala Phe Phe Glu Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu
1685 1690 1695
Pro Leu Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala
1700 1705 1710
Asp Glu Val Lys Ser Cys Phe Arg Val Gly Trp Thr Asp Asp Ser Ser
1715 1720 1725
Pro Glu Arg Gly Phe Arg Tyr Ile Tyr Met Thr Asp Glu Asp His Asp
1730 1735 1740
Arg Ile Gly Ser Ser Val Ile Ala His Lys Met Gln Leu Asp Ser Gly
1745 1750 1755 1760
Glu Ile Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu
1765 1770 1775
Gly Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser
1780 1785 1790
Arg Ala Tyr Glu Glu Thr Phe Thr Leu Thr Phe Val Thr Gly Arg Thr
1795 1800 1805
Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu Gly Ile Arg Cys Ile Gln
1810 1815 1820
Arg Ile Asp Gln Pro Ile Ile Leu Thr Gly Phe Ser Ala Leu Asn Lys
1825 1830 1835 1840
Leu Leu Gly Arg Glu Val Tyr Ser Ser His Met Gln Leu Gly Gly Pro
1845 1850 1855
Lys Ile Met Ala Thr Asn Gly Val Val His Leu Thr Val Pro Asp Asp
1860 1865 1870
Leu Glu Gly Val Ser Asn Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala
1875 1880 1885
Asn Ile Gly Gly Pro Leu Pro Ile Thr Lys Ser Leu Asp Pro Ile Asp
1890 1895 1900
Arg Pro Val Ala Tyr Ile Pro Glu Asn Thr Cys Asp Pro Arg Ala Ala
1905 1910 1915 1920
Ile Ser Gly Ile Asp Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe
1925 1930 1935
Asp Lys Asp Ser Phe Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val
1940 1945 1950
Val Thr Gly Arg Ala Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala
1955 1960 1965
Val Glu Thr Gln Thr Met Met Gln Leu Val Pro Ala Asp Pro Gly Gln
1970 1975 1980
Pro Asp Ser His Glu Arg Ser Val Pro Arg Ala Gly Gln Val Trp Phe
1985 1990 1995 2000
Pro Asp Ser Ala Thr Lys Thr Ala Gln Ala Met Leu Asp Phe Asn Arg
2005 2010 2015
Glu Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly
2020 2025 2030
Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr Ile
2035 2040 2045
Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro Ala Phe Val Tyr Ile Pro
2050 2055 2060
Lys Ala Ala Glu Leu Arg Gly Gly Ala Trp Val Val Ile Asp Ser Lys
2065 2070 2075 2080
Ile Asn Pro Asp Arg Ile Glu Cys Tyr Ala Glu Arg Thr Ala Lys Gly
2085 2090 2095
Asn Val Leu Glu Pro Gln Gly Leu Ile Glu Ile Lys Phe Arg Ser Glu
2100 2105 2110
Glu Leu Lys Glu Cys Met Gly Arg Leu Asp Pro Glu Leu Ile Asp Leu
2115 2120 2125
Lys Ala Arg Leu Gln Gly Ala Asn Gly Ser Leu Ser Asp Gly Glu Ser
2130 2135 2140
Leu Gln Lys Ser Ile Glu Ala Arg Lys Lys Gln Leu Leu Pro Leu Tyr
2145 2150 2155 2160
Thr Gln Ile Ala Val Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg
2165 2170 2175
Met Ala Ala Lys Gly Val Ile Arg Lys Val Val Asp Trp Glu Asp Ser
2180 2185 2190
Arg Ser Phe Phe Tyr Lys Arg Leu Arg Arg Arg Leu Ser Glu Asp Val
2195 2200 2205
Leu Ala Lys Glu Ile Arg Gly Val Ile Gly Glu Lys Phe Pro His Lys
2210 2215 2220
Ser Ala Ile Glu Leu Ile Lys Lys Trp Tyr Leu Ala Ser Glu Ala Ala
2225 2230 2235 2240
Ala Ala Gly Ser Thr Asp Trp Asp Asp Asp Asp Ala Phe Val Ala Trp
2245 2250 2255
Arg Glu Asn Pro Glu Asn Tyr Lys Glu Tyr Ile Lys Glu Leu Arg Ala
2260 2265 2270
Gln Arg Val Ser Arg Leu Leu Ser Asp Val Ala Gly Ser Ser Ser Asp
2275 2280 2285
Leu Gln Ala Leu Pro Gln Gly Leu Ser Met Leu Leu Asp Lys Met Asp
2290 2295 2300
Pro Ser Lys Arg Ala Gln Phe Ile Glu Glu Val Met Lys Val Leu Lys
2305 2310 2315 2320
<210> 4
<211> 6963
<212> DNA
<213> 大穗看麦娘ACCase基因DNA序列(DNA序列)
<400> 4
atgggatcca cacatctgcc cattgtcggg tttaatgcat ccacaacacc atcgctatcc 60
actcttcgcc agataaactc agctgctgct gcattccaat cttcgtcccc ttcaaggtca 120
tccaagaaga aaagccgacg tgttaagtca ataagggatg atggcgatgg aagcgtgcca 180
gaccctgcag gccatggcca gtctattcgc caaggtctcg ctggcatcat cgacctccca 240
aaggagggcg catcagctcc agatgtggac atttcacatg ggtctgaaga ccacaaggcc 300
tcctaccaaa tgaatgggat actgaatgaa tcacataacg ggaggcacgc ctctctgtct 360
aaagtttatg aattttgcac ggaattgggt ggaaaaacac caattcacag tgtattagtc 420
gccaacaatg gaatggcagc agctaagttc atgcggagtg tccggacatg ggctaatgat 480
acatttgggt cagagaaggc gattcagttg atagctatgg caactccgga agacatgaga 540
ataaatgcag agcacattag aattgctgat cagtttgttg aagtacctgg tggaacaaac 600
aataacaact atgcaaatgt ccaactcata gtggagatag cagagagaac tggtgtctcc 660
gccgtttggc ctggttgggg ccatgcatct gagaatcctg aacttccaga tgcactaact 720
gcaaaaggaa ttgtttttct tgggccacca gcatcatcaa tgaacgcact aggcgacaag 780
gttggttcag ctctcattgc tcaagcagca ggggttccca ctcttgcttg gagtggatca 840
catgtggaaa ttccattaga actttgtttg gactcgatac ctgaggagat gtataggaaa 900
gcctgtgtta caaccgctga tgaagcagtt gcaagttgtc agatgattgg ttaccctgcc 960
atgatcaagg catcctgggg tggtggtggt aaagggatta gaaaggttaa taatgatgac 1020
gaggtgaaag cactgtttaa gcaagtacag ggtgaagttc ctggctcccc gatatttatc 1080
atgagacttg catctcagag tcgtcatctt gaagtccagc tgctttgtga tgaatatggc 1140
aatgtagcag cacttcacag tcgtgattgc agtgtgcaac gacgacacca aaagattatc 1200
gaggaaggac cagttactgt tgctcctcgt gaaacagtga aagagctaga gcaagcagca 1260
aggaggcttg ctaaggccgt gggttacgtc ggtgctgcta ctgttgaata tctctacagc 1320
atggagactg gtgaatacta ttttctggag cttaatccac ggttgcaggt tgagcaccca 1380
gtcaccgagt cgatagctga agtaaatttg cctgcagccc aagttgcagt tgggatgggt 1440
ataccccttt ggcagattcc agagatcaga cgtttctacg gaatggacaa tggaggaggc 1500
tatgatattt ggaggaaaac agcagctctc gctactccat tcaactttga tgaagtagat 1560
tctcaatggc cgaagggtca ttgtgtggca gttaggataa ccagtgagaa tccagatgat 1620
ggattcaagc ctactggtgg aaaagtaaag gagataagtt ttaaaagtaa gccaaatgtc 1680
tggggatatt tctcagttaa gtctggtgga ggcattcatg aatttgcgga ttctcagttt 1740
ggacacgttt ttgcctatgg agagactaga tcagcagcaa taaccagcat gtctcttgca 1800
ctaaaagaga ttcaaattcg tggagaaatt catacaaacg ttgattacac ggttgatctc 1860
ttgaatgccc cagacttcag agaaaacacg atccataccg gttggctgga taccagaata 1920
gctatgcgtg ttcaagctga gaggcctccc tggtatattt cagtggttgg aggagctcta 1980
tataaaacaa taaccaccaa tgcggagacc gtttctgaat atgttagcta tctcatcaag 2040
ggtcagattc caccaaagca catatccctt gtccattcaa ctatttcttt gaatatagag 2100
gaaagcaaat atacaattga gattgtgagg agtggacagg gtagctacag attgagactg 2160
aatggatcac ttattgaagc caatgtacaa acattatgtg atggaggcct tttaatgcag 2220
ctggatggaa atagccatgt tatttatgct gaagaagaag cgggtggtac acggcttctt 2280
attgatggaa aaacatgctt gctacagaat gaccatgatc cgtcaaggtt attagctgag 2340
acaccctgca aacttcttcg tttcttgatt gccgatggtg ctcatgttga tgctgatgta 2400
ccatacgcgg aagttgaggt tatgaagatg tgcatgcccc tcttgtcgcc tgctgctggt 2460
gtcattaatg ttttgttgtc tgagggccag gcgatgcagg ctggtgatct tatagcgaga 2520
cttgatctcg atgacccttc tgctgtgaag agagccgagc catttgaagg atcttttcca 2580
gaaatgagcc ttcctattgc tgcttctggc caagttcaca aaagatgtgc tgcaagtttg 2640
aacgctgctc gaatggtcct tgcaggatat gaccatgcgg ccaacaaagt tgtgcaagat 2700
ttggtatggt gccttgatac acctgctctt cctttcctac aatgggaaga gcttatgtct 2760
gttttagcaa ctagacttcc aagacgtctt aagagcgagt tggagggcaa atacaatgaa 2820
tacaagttaa atgttgacca tgtgaagatc aaggatttcc ctaccgagat gcttagagag 2880
acaatcgagg aaaatcttgc atgtgtttcc gagaaggaaa tggtgacaat tgagaggctt 2940
gttgaccctc tgatgagcct gctgaagtca tacgagggtg ggagagaaag ccatgcccac 3000
tttattgtca agtccctttt tgaggagtat ctctcggttg aggaactatt cagtgatggc 3060
attcagtctg acgtgattga acgcctgcgc ctacaatata gtaaagacct ccagaaggtt 3120
gtagacattg ttttgtctca ccagggtgtg agaaacaaaa caaagctgat actcgcgctc 3180
atggagaaac tggtctatcc aaaccctgct gcctacagag atcagttgat tcgcttttct 3240
tccctcaacc ataaaagata ttataagttg gctcttaaag ctagtgaact tcttgaacaa 3300
accaagctca gcgaactccg cacaagcatt gcaaggaacc tttcagcgct ggatatgttc 3360
accgaggaaa aggcagattt ctccttgcaa gacagaaaat tggccattaa tgagagcatg 3420
ggagatttag tcactgcccc actgccagtt gaagatgcac ttgtttcttt gtttgattgt 3480
actgatcaaa ctcttcagca gagagtgatt cagacataca tatctcgatt ataccagcct 3540
caacttgtga aggatagcat ccagctgaaa tatcaggatt ctggtgttat tgctttatgg 3600
gaattcactg aaggaaatca tgagaagaga ttgggtgcta tggttatcct gaagtcacta 3660
gaatctgtgt caacagccat tggagctgct ctaaaggatg catcacatta tgcaagctct 3720
gcgggcaaca cggtgcatat tgctttgttg gatgctgata cccaactgaa tacaactgaa 3780
gatagtggtg ataatgacca agctcaagac aagatggata aactttcttt tgtactgaaa 3840
caagatgttg tcatggctga tctacgtgct gctgatgtca aggttgttag ttgcattgtt 3900
caaagagatg gagcaatcat gcctatgcgc cgtaccttcc tcttgtcaga ggaaaaactt 3960
tgttacgagg aagagccgat tcttcggcat gtggagcctc cactttctgc acttcttgag 4020
ttggataaat tgaaagtgaa aggatacaat gagatgaagt atacaccgtc acgtgatcgt 4080
cagtggcata tatacacact tagaaatact gaaaatccaa aaatgctgca cagggtattt 4140
ttccgaacac ttgtcagaca acccagtgca ggcaacaggt ttacatcaga ccatatcact 4200
gatgttgaag taggacacgc agaggaacct ctttcattta cttcaagcag catattaaaa 4260
tcgttgaaga ttgctaaaga agaattggag cttcacgcga tcaggactgg ccattctcat 4320
atgtacttgt gcatattgaa agagcaaaag cttcttgacc ttgttcctgt ttcagggaac 4380
actgttgtgg atgttggtca agatgaagct actgcatgct ctcttttgaa agaaatggct 4440
ttaaagatac atgaacttgt tggtgcaaga atgcatcatc tttctgtatg ccagtgggaa 4500
gtgaaactta agttggtgag cgatgggcct gccagtggta gctggagagt tgtaacaacc 4560
aatgttactg gtcacacctg cactgtggat atctaccggg aggtcgaaga tacagaatca 4620
cagaaactag tataccactc caccgcattg tcatctggtc ctttgcatgg tgttgcactg 4680
aatacttcgt atcagccttt gagtgttatt gatttaaaac gttgctctgc caggaacaac 4740
aaaactacat actgctatga ttttccattg acatttgaag ctgcagtgca gaagtcgtgg 4800
tctaacattt ccagtgaaaa caaccaatgt tatgttaaag cgacagagct tgtgtttgct 4860
gaaaagaatg ggtcgtgggg cactcctata attcctatgc agcgtgctgc tgggctgaat 4920
gacattggta tggtagcctg gatcttggac atgtccactc ctgaatttcc cagcggcaga 4980
cagatcattg ttatcgcaaa tgatattaca tttagagctg gatcatttgg cccaagggaa 5040
gatgcatttt tcgaagctgt aaccaacctg gcttgtgaga agaagcttcc acttatctac 5100
ttggctgcaa actctggtgc tcggattggc attgctgatg aagtaaaatc ttgcttccgt 5160
gttggatgga ctgatgatag cagccctgaa cgtggattta ggtacattta tatgactgac 5220
gaagaccatg atcgtattgg ctcttcagtt atagcacaca agatgcagct agatagtggc 5280
gagatcaggt gggttattga ttctgttgtg ggaaaagagg atggactagg tgtggagaac 5340
atacatggaa gtgctgctat tgccagtgcc tattctaggg cgtacgagga gacatttaca 5400
cttacattcg ttactggacg aactgttgga atcggagcct atcttgctcg acttggcata 5460
cggtgcatac agcgtattga ccagcccatt attttgaccg ggttttctgc cctgaacaag 5520
cttcttgggc gggaggtgta cagctcccac atgcagttgg gtggtcccaa aatcatggcg 5580
acgaatggtg ttgtccatct gactgttcca gatgaccttg aaggtgtttc taatatattg 5640
aggtggctca gctatgttcc tgcaaacatt ggtggacctc ttcctattac aaaatctttg 5700
gacccaatag acagacccgt tgcatacatc cctgagaata catgtgatcc tcgtgcagcc 5760
atcagtggca ttgatgacag ccaagggaaa tggttgggtg gcatgtttga caaagacagt 5820
tttgtggaga catttgaagg atgggcgaag acagtagtta ctggcagagc aaaacttgga 5880
gggattcctg ttggtgttat agctgtggag acacagacca tgatgcagct cgtccccgct 5940
gatccaggcc agcctgattc ccacgagcgg tctgttcctc gtgctgggca agtttggttt 6000
ccagattctg ctaccaagac agcgcaggcg atgttggact tcaaccgtga aggattacct 6060
ctgttcatac ttgctaactg gagaggcttc tctggagggc aaagagatct ttttgaagga 6120
attctgcagg ctgggtcaac aattgttgag aaccttagga catacaatca gcctgccttt 6180
gtatatatcc ccaaggctgc agagctacgt ggaggagcct gggtcgtgat tgatagcaag 6240
ataaacccag atcgcatcga gtgctatgct gagaggactg caaagggtaa tgttctcgaa 6300
cctcaagggt tgattgagat caagttcagg tcagaggaac tcaaagaatg catgggtagg 6360
cttgatccag aattgataga tctgaaagca agactccagg gagcaaatgg aagcctatct 6420
gatggagaat cccttcagaa gagcatagaa gctcggaaga aacagttgct gcctctgtac 6480
acccaaatcg cggtacgttt tgcggaattg cacgacactt cccttagaat ggctgctaaa 6540
ggtgtgatca ggaaagttgt agactgggaa gactctcggt ctttcttcta caagagatta 6600
cggaggaggc tatccgagga cgttctggca aaggagatta gaggtgtaat tggtgagaag 6660
tttcctcaca aatcagcgat cgagctgatc aagaaatggt acttggcttc tgaggcagct 6720
gcagcaggaa gcaccgactg ggatgacgac gatgcttttg tcgcctggag ggagaaccct 6780
gaaaactata aggagtatat caaagagctt agggctcaaa gggtatctcg gttgctctca 6840
gatgttgcag gctccagttc ggatttacaa gccttgccgc agggtctttc catgctacta 6900
gataagatgg atccctctaa gagagcacag tttatcgagg aggtcatgaa ggtcctgaaa 6960
tga 6963
<210> 5
<211> 446
<212> PRT
<213> 水稻HPPD蛋白氨基酸序列(氨基酸序列)
<400> 5
Met Pro Pro Thr Pro Thr Pro Thr Ala Thr Thr Gly Ala Val Ser Ala
1 5 10 15
Ala Ala Ala Ala Gly Glu Asn Ala Gly Phe Arg Leu Val Gly His Arg
20 25 30
Arg Phe Val Arg Ala Asn Pro Arg Ser Asp Arg Phe Gln Ala Leu Ala
35 40 45
Phe His His Val Glu Leu Trp Cys Ala Asp Ala Ala Ser Ala Ala Gly
50 55 60
Arg Phe Ala Phe Ala Leu Gly Ala Pro Leu Ala Ala Arg Ser Asp Leu
65 70 75 80
Ser Thr Gly Asn Ser Ala His Ala Ser Leu Leu Leu Arg Ser Ala Ser
85 90 95
Val Ala Phe Leu Phe Thr Ala Pro Tyr Gly Gly Asp His Gly Val Gly
100 105 110
Ala Asp Ala Ala Thr Thr Ala Ser Ile Pro Ser Phe Ser Pro Gly Ala
115 120 125
Ala Arg Arg Phe Ala Ala Asp His Gly Leu Ala Val His Ala Val Ala
130 135 140
Leu Arg Val Ala Asp Ala Ala Asp Ala Phe Arg Ala Ser Val Ala Ala
145 150 155 160
Gly Ala Arg Pro Ala Phe Gln Pro Ala Asp Leu Gly Gly Gly Phe Gly
165 170 175
Leu Ala Glu Val Glu Leu Tyr Gly Asp Val Val Leu Arg Phe Val Ser
180 185 190
His Pro Asp Gly Ala Asp Ala Pro Phe Leu Pro Gly Phe Glu Gly Val
195 200 205
Ser Asn Pro Gly Ala Val Asp Tyr Gly Leu Arg Arg Phe Asp His Val
210 215 220
Val Gly Asn Val Pro Glu Leu Ala Pro Val Ala Ala Tyr Ile Ser Gly
225 230 235 240
Phe Thr Gly Phe His Glu Phe Ala Glu Phe Thr Ala Glu Asp Val Gly
245 250 255
Thr Ala Glu Ser Gly Leu Asn Ser Val Val Leu Ala Asn Asn Ala Glu
260 265 270
Thr Val Leu Leu Pro Leu Asn Glu Pro Val His Gly Thr Lys Arg Arg
275 280 285
Ser Gln Ile Gln Thr Tyr Leu Asp His His Gly Gly Pro Gly Val Gln
290 295 300
His Ile Ala Leu Ala Ser Asp Asp Val Leu Gly Thr Leu Arg Glu Met
305 310 315 320
Arg Ala Arg Ser Ala Met Gly Gly Phe Glu Phe Leu Ala Pro Pro Pro
325 330 335
Pro Asn Tyr Tyr Asp Gly Val Arg Arg Arg Ala Gly Asp Val Leu Ser
340 345 350
Glu Glu Gln Ile Asn Glu Cys Gln Glu Leu Gly Val Leu Val Asp Arg
355 360 365
Asp Asp Gln Gly Val Leu Leu Gln Ile Phe Thr Lys Pro Val Gly Asp
370 375 380
Arg Pro Thr Phe Phe Leu Glu Met Ile Gln Arg Ile Gly Cys Met Glu
385 390 395 400
Lys Asp Glu Ser Gly Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly Phe
405 410 415
Gly Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu Glu Tyr Glu
420 425 430
Lys Ser Leu Glu Ala Lys Gln Ala Pro Thr Val Gln Gly Ser
435 440 445
<210> 6
<211> 2099
<212> DNA
<213> 水稻HPPD基因组DNA序列(DNA序列)
<400> 6
atgcctccca ctcccacccc caccgccacc accggcgccg tctcggccgc tgcggcggcg 60
ggggagaacg cggggttccg cctcgtcggg caccgccgct tcgtccgcgc caacccgcgg 120
agcgaccggt tccaggcgct cgcgttccac cacgtcgagc tctggtgcgc cgacgccgcg 180
tccgccgcgg gccggttcgc cttcgccctg ggcgcgccgc tcgccgccag gtccgacctc 240
tccacgggga actccgcgca cgcctccctc ctcctccgct ccgcctccgt cgcgttcctc 300
ttcaccgccc cctacggcgg cgaccacggc gtcggcgcgg acgcggccac caccgcctcc 360
atcccttcct tctccccagg cgccgcgcgg aggttcgccg cggaccacgg cctcgcggtg 420
cacgccgtgg cgctgcgcgt cgccgacgcg gccgacgcct tccgcgccag cgtcgcggcc 480
ggtgcgcgcc cggcgttcca gcccgccgac ctcggcggtg gcttcggcct cgcggaggtg 540
gagctctacg gcgacgtcgt gctccgcttc gtcagccacc cggacggcgc cgacgcgccc 600
ttcctcccgg gtttcgaggg cgtcagcaac ccgggcgccg tggactacgg cctccgccgg 660
ttcgaccacg tcgtcggcaa cgtgccggag ctcgctccgg tagccgcgta catctccggg 720
ttcaccgggt tccacgagtt cgccgagttc accgccgagg acgtgggcac cgccgagagc 780
ggcctcaact cggtggtgct cgccaacaac gcggagaccg tgctgctgcc gctcaacgag 840
ccggtgcacg gcaccaagcg gcggagccag atacagacgt acctggacca ccacggcggc 900
ccgggggtgc agcacatcgc gctggccagc gacgacgtgc tcgggacgct gagggagatg 960
cgggcgcgct ccgccatggg cggcttcgag ttcttggcgc cgccgccgcc caactactac 1020
gacggcgtgc ggcggcgcgc cggggacgtg ctctcggagg agcagatcaa cgagtgccag 1080
gagctcgggg tgctcgtgga cagggatgac cagggggtgt tgctccagat cttcaccaag 1140
ccagtaggag acaggtaaaa tcctcacctc tttcatgatg aaaatggctt atgaattcag 1200
atttgcagtt atttgttggc acatagcatc gattaggcgc agaaaggtgt caagcattat 1260
gaaattaatc cagaatgctt gaataataca gtataatata tgatagtgag ctctgtgata 1320
ctccatggat actctttatg tgtctccatg aatccatgat gcgcctttct gaagattgtg 1380
acactagaaa gggaataaag ctgaatgtgc ataggaaaaa aatgaaaagc caatgtgtgt 1440
ctgtttatgc cttcttgcaa gcatatccca gttccttttt gccggcatgt tgtaatgcag 1500
atagccagcc acatatagct acttaattag tgagtactcc ctctcacaat gtaagtcatt 1560
ctagtatttt ccacattcat attgatgcta atctatctag attcattagc atcaatatga 1620
atatgggaaa tactagaatg acttacattg tgaaacggag gaagtattac ttactacatc 1680
taaggtccat ggattccttt ttttacaaaa gaaagaaaga atcttatggc aactccatca 1740
gcataaacca gcaatgctgc tgggaacaac ttaaacttta ggttcaggag gttgtaattg 1800
tctttaagct taatagtctg attcagtcag tattctaatt tctgctgcat ctttgctatt 1860
gttatttcct ctctgtgact ccaaatctaa ctggatcagc tatttcactc aggccaacct 1920
ttttcttgga gatgatacaa aggattgggt gcatggagaa ggatgagagt gggcaggagt 1980
accagaaggg cggctgcggc gggtttggga agggcaactt ctcggagctg ttcaagtcca 2040
ttgaggagta tgagaaatcc cttgaagcca agcaagcccc tacagttcaa ggatcctag 2099
<210> 7
<211> 536
<212> PRT
<213> 水稻PPO1蛋白氨基酸序列(氨基酸序列)
<400> 7
Met Ala Ala Ala Ala Ala Ala Met Ala Thr Ala Thr Ser Ala Thr Ala
1 5 10 15
Ala Pro Pro Leu Arg Ile Arg Asp Ala Ala Arg Arg Thr Arg Arg Arg
20 25 30
Gly His Val Arg Cys Ala Val Ala Ser Gly Ala Ala Glu Ala Pro Ala
35 40 45
Ala Pro Gly Ala Arg Val Ser Ala Asp Cys Val Val Val Gly Gly Gly
50 55 60
Ile Ser Gly Leu Cys Thr Ala Gln Ala Leu Ala Thr Lys His Gly Val
65 70 75 80
Gly Asp Val Leu Val Thr Glu Ala Arg Ala Arg Pro Gly Gly Asn Ile
85 90 95
Thr Thr Ala Glu Arg Ala Gly Glu Gly Tyr Leu Trp Glu Glu Gly Pro
100 105 110
Asn Ser Phe Gln Pro Ser Asp Pro Val Leu Thr Met Ala Val Asp Ser
115 120 125
Gly Leu Lys Asp Asp Leu Val Phe Gly Asp Pro Asn Ala Pro Arg Phe
130 135 140
Val Leu Trp Glu Gly Lys Leu Arg Pro Val Pro Ser Lys Pro Gly Asp
145 150 155 160
Leu Pro Phe Phe Asp Leu Met Ser Ile Pro Gly Lys Leu Arg Ala Gly
165 170 175
Leu Gly Ala Leu Gly Val Arg Ala Pro Pro Pro Gly Arg Glu Glu Ser
180 185 190
Val Glu Asp Phe Val Arg Arg Asn Leu Gly Ala Glu Val Phe Glu Arg
195 200 205
Leu Ile Glu Pro Phe Cys Ser Gly Val Tyr Ala Gly Asp Pro Ser Lys
210 215 220
Leu Ser Met Lys Ala Ala Phe Gly Lys Val Trp Arg Leu Glu Asp Thr
225 230 235 240
Gly Gly Ser Ile Ile Gly Gly Thr Ile Lys Thr Ile Gln Glu Arg Gly
245 250 255
Lys Asn Pro Lys Pro Pro Arg Asp Pro Arg Leu Pro Thr Pro Lys Gly
260 265 270
Gln Thr Val Ala Ser Phe Arg Lys Gly Leu Thr Met Leu Pro Asp Ala
275 280 285
Ile Thr Ser Arg Leu Gly Ser Lys Val Lys Leu Ser Trp Lys Leu Thr
290 295 300
Ser Ile Thr Lys Ser Asp Asn Lys Gly Tyr Ala Leu Val Tyr Glu Thr
305 310 315 320
Pro Glu Gly Val Val Ser Val Gln Ala Lys Thr Val Val Met Thr Ile
325 330 335
Pro Ser Tyr Val Ala Ser Asp Ile Leu Arg Pro Leu Ser Ser Asp Ala
340 345 350
Ala Asp Ala Leu Ser Ile Phe Tyr Tyr Pro Pro Val Ala Ala Val Thr
355 360 365
Val Ser Tyr Pro Lys Glu Ala Ile Arg Lys Glu Cys Leu Ile Asp Gly
370 375 380
Glu Leu Gln Gly Phe Gly Gln Leu His Pro Arg Ser Gln Gly Val Glu
385 390 395 400
Thr Leu Gly Thr Ile Tyr Ser Ser Ser Leu Phe Pro Asn Arg Ala Pro
405 410 415
Ala Gly Arg Val Leu Leu Leu Asn Tyr Ile Gly Gly Ser Thr Asn Thr
420 425 430
Gly Ile Val Ser Lys Thr Glu Ser Glu Leu Val Glu Ala Val Asp Arg
435 440 445
Asp Leu Arg Lys Met Leu Ile Asn Pro Lys Ala Val Asp Pro Leu Val
450 455 460
Leu Gly Val Arg Val Trp Pro Gln Ala Ile Pro Gln Phe Leu Ile Gly
465 470 475 480
His Leu Asp His Leu Glu Ala Ala Lys Ser Ala Leu Gly Lys Gly Gly
485 490 495
Tyr Asp Gly Leu Phe Leu Gly Gly Asn Tyr Val Ala Gly Val Ala Leu
500 505 510
Gly Arg Cys Val Glu Gly Ala Tyr Glu Ser Ala Ser Gln Ile Ser Asp
515 520 525
Tyr Leu Thr Lys Tyr Ala Tyr Lys
530 535
<210> 8
<211> 3246
<212> DNA
<213> 水稻PPO1基因组DNA序列(DNA序列)
<400> 8
atggccgccg ccgccgcagc catggccacc gccacctccg ccacggcagc gccgccgctc 60
cgcattcgcg acgccgcgag gaggacccgc cgacgcggcc acgttcgctg cgccgtcgcc 120
agcggcgcgg ccgaggcgcc cgcggcgccc ggggcgcggg tgtcggcgga ctgcgtcgtg 180
gtgggcggcg gcatcagcgg gctctgcacc gcgcaggcgc tggccacaaa gcacggcgtc 240
ggcgacgtgc tcgtcacgga ggcccgcgcc cgccccggcg gcaacatcac caccgccgag 300
cgcgccggcg agggctacct ctgggaggag gggcccaaca gcttccagcc ttccgacccc 360
gtcctcacca tggccgtacg tcttcttgct ccccttctct tctgattctc tcgcggcgga 420
gacgacatga atgggaatgg tggtgcatgg attggggcgc gcaggtggac agcgggctca 480
aggacgatct cgtgttcggg gaccccaacg cgccgcggtt cgtgctgtgg gaggggaagc 540
taaggccggt gccgtccaag cccggcgacc tgccgttctt cgacctcatg agcatccccg 600
gcaagctcag ggccggcctt ggcgcgctcg gcgttcgagc gccacctcca gtttgtgtgc 660
tctccccgct gtgcattctt gattcacttg tgaaattcga ttgtgctgag cgtttccggc 720
gaaggtttca ggggcgtgag gagtcggtgg aggacttcgt gcggcgcaac ctcggcgcgg 780
aggtctttga gcgcctcatt gagcctttct gctcaggtgt ttattgtagt gtgcaattgc 840
tgttttgttt ttgatgattc agataagaat acggtgattt cggtgcttag gtgtgtatgc 900
tggtgatcct tcaaagctca gtatgaaggc tgcatttggg aaggtgtgga ggctggagga 960
tactggaggt agcattattg gtggaaccat caaaacaatc caggagaggg ggaaaaaccc 1020
caaaccgccg agggatccgt gagtgagaaa ttgccttctt tgttggatta attgtccatt 1080
gtgttacact gatatgcctt caccattttt agccgccttc caacgccaaa ggggcagaca 1140
gttgcatctt tcaggaaggg tctgactatg ctcccggatg ctattacatc taggtttgtt 1200
atcattgtct ttgtaattta cctagttctt caactatgga tattaggtgc tgtagattgt 1260
tcagatagat gcacattgta caacaatcta ggtagattga ttgctatggc ttgttgaatt 1320
aactgtttca cttgcatcat tgcctcagca catatgaagc atatggatag attcttcaat 1380
catttatccc tcaataacac aattttgaca ccagtgcttc tccttttttt catcctgctt 1440
catctggcta tccacaatat aattaagcat acaaaagagg cactctttga tggacaattc 1500
atagtgttgt gggttaatat tcatttgcat tctttgaggg acaattcgtt acaccctaac 1560
atgaactagt aatgattggg gtgcttaacc atttgttctg catttcctcc attttcaggt 1620
tgggtagcaa agtcaaactt tcatggaagt tgacaagcat tacaaagtca gacaacaaag 1680
gatatgcatt agtgtatgaa acaccagaag gggtggtctc ggtgcaagct aaaactgttg 1740
tcatgaccat cccatcatat gttgctagtg atatcttgcg gccactttca gtaagttata 1800
tatatttaat taactttctg ttcccaaaat acactgcagc acttcattgc ttcctgaggt 1860
cctcgattca tttttcggta gacaggaagt agtattcatt tgcacttttt aagggattaa 1920
ttcaacatat ccactggaaa tatacatatc ctacacatcc tgtcaacata cttgctaaac 1980
agcattttgt ttgagttgac tggcatctca gcagccaatt actatcttta ggggacaagc 2040
cacattctta ataaatcctg tcggaaatca ctttttgatt tttatagatt agtgttgtca 2100
tagaatttgg cttggtgatc tacttggtaa ggttaactga ttcacaagtc ggacaatttc 2160
ttcaccaatc tagcagtatg tttaagtgtg ttggtactta attctaaatg tcctgcgcat 2220
ggtaacatat catatgcaaa aattcctcag taaccgaaat ttatactgta agttttaact 2280
gtctttacac tgttaatttt agacatactt cttccttgct tgttcattga acttgtttcc 2340
cccttccaca gagtgatgca gcagatgctc tgtcaatatt ctattatcca ccagttgctg 2400
ctgtaactgt ttcatatcca aaagaagcaa ttagaaaaga atgcttaatt gacggagagc 2460
tccagggttt cggccagctg catccgcgta gtcagggagt tgagacttta ggtacttata 2520
ggaattcaac cttattattc ttctaacata taaatgaact aatctttctt gtctagtttg 2580
catttattgt ggattaagtt tggttatatt gttcttacaa gtttgtggta ttattttgta 2640
taggaacaat atatagctca tcactctttc caaatcgtgc tccagctgga agggtgttac 2700
ttctgaacta cataggaggt tctacaaata cagggattgt ttccaaggta tcgctgtcaa 2760
gttgtttatt ttgcgactat atgattacag tatcctgttt ttcaactcca gctgctgtta 2820
gactgtcata ataaatctgc tactacatgt ttgcacacta tttgactgca tttaaaaact 2880
cagatagcct atatttttag ttgcctgcta ctgggtgtat ttctaatgat cccatcatgt 2940
ttgcagactg aaagtgagct ggtagaagca gttgaccgtg acctcaggaa gatgctgata 3000
aatcctaaag cagtggaccc tttggtcctt ggcgtccggg tatggccaca agccatacca 3060
cagttcctca ttggccatct tgatcatctt gaggctgcaa aatctgccct gggcaaaggt 3120
ggttatgatg gattgttcct cggagggaac tatgttgcag gagttgccct gggccgatgc 3180
gttgaaggtg catatgagag tgcctcacaa atatctgact acttgaccaa gtacgcctac 3240
aagtga 3246
<210> 9
<211> 587
<212> PRT
<213> 水稻TIR1蛋白氨基酸序列(氨基酸序列)
<400> 9
Met Gly Arg Gly Gly Ser Arg Ala Ala Cys Ala Ala Ala Ala Pro Pro
1 5 10 15
Trp His Ser Leu Pro Asp Glu Val Trp Glu His Ala Phe Ser Phe Leu
20 25 30
Pro Ala Ala Ala Asp Arg Gly Ala Ala Ala Gly Ala Cys Ser Ser Trp
35 40 45
Leu Arg Ala Glu Arg Arg Ser Arg Arg Arg Leu Ala Val Ala Asn Cys
50 55 60
Tyr Ala Ala Ala Pro Arg Asp Ala Val Glu Arg Phe Pro Ser Val Arg
65 70 75 80
Ala Ala Glu Val Lys Gly Lys Pro His Phe Ala Asp Phe Gly Leu Val
85 90 95
Pro Pro Ala Trp Gly Ala Ala Ala Ala Pro Trp Ile Ala Ala Ala Ala
100 105 110
Asp Gly Trp Pro Leu Leu Glu Glu Leu Ser Phe Lys Arg Met Val Val
115 120 125
Thr Asp Glu Cys Leu Glu Met Ile Ala Ala Ser Phe Arg Asn Phe Gln
130 135 140
Val Leu Arg Leu Val Ser Cys Asp Gly Phe Ser Thr Ala Gly Leu Ala
145 150 155 160
Ala Ile Ala Ala Gly Cys Arg His Leu Arg Glu Leu Asp Leu Gln Glu
165 170 175
Asn Glu Ile Glu Asp Cys Ser Ile His Trp Leu Ser Leu Phe Pro Glu
180 185 190
Ser Phe Thr Ser Leu Val Thr Leu Asn Phe Ser Cys Leu Glu Gly Glu
195 200 205
Val Asn Ile Thr Val Leu Glu Arg Leu Val Thr Arg Cys His Asn Leu
210 215 220
Lys Thr Leu Lys Leu Asn Asn Ala Ile Pro Leu Asp Lys Leu Ala Ser
225 230 235 240
Leu Leu His Lys Ala Pro Gln Leu Val Glu Leu Gly Thr Gly Lys Phe
245 250 255
Ser Ala Asp Tyr His Ser Asp Leu Phe Ala Lys Leu Glu Ala Ala Phe
260 265 270
Gly Gly Cys Lys Ser Leu Arg Arg Leu Ser Gly Ala Trp Asp Ala Val
275 280 285
Pro Asp Tyr Leu Pro Ala Phe Tyr Cys Val Cys Glu Gly Leu Thr Ser
290 295 300
Leu Asn Leu Ser Tyr Ala Thr Val Arg Gly Pro Glu Leu Ile Lys Phe
305 310 315 320
Ile Ser Arg Cys Arg Asn Leu Gln Gln Leu Trp Val Met Asp Leu Ile
325 330 335
Glu Asp His Gly Leu Ala Val Val Ala Ser Ser Cys Asn Lys Leu Gln
340 345 350
Glu Leu Arg Val Phe Pro Ser Asp Pro Phe Gly Ala Gly Phe Leu Thr
355 360 365
Glu Arg Gly Leu Val Asp Val Ser Ala Ser Cys Pro Met Leu Glu Ser
370 375 380
Val Leu Tyr Phe Cys Arg Arg Met Thr Asn Glu Ala Leu Ile Thr Ile
385 390 395 400
Ala Lys Asn Arg Pro Asn Phe Thr Cys Phe Arg Leu Cys Ile Leu Glu
405 410 415
Pro His Thr Pro Asp Tyr Ile Thr Arg Glu Pro Leu Asp Ala Gly Phe
420 425 430
Ser Ala Ile Val Glu Ser Cys Arg Gly Leu Arg Arg Leu Ser Ile Ser
435 440 445
Gly Leu Leu Thr Asp Leu Val Phe Lys Ser Ile Gly Ala His Ala Asp
450 455 460
Arg Leu Glu Met Leu Ser Ile Ala Phe Ala Gly Asn Ser Asp Leu Gly
465 470 475 480
Leu His Tyr Ile Leu Ser Gly Cys Lys Ser Leu Lys Lys Leu Glu Ile
485 490 495
Arg Asp Cys Pro Phe Gly Asp Lys Pro Leu Leu Ala Asn Ala Ala Lys
500 505 510
Leu Glu Thr Met Arg Ser Leu Trp Met Ser Ser Cys Leu Leu Thr Leu
515 520 525
Gly Ala Cys Arg Gln Leu Ala Arg Lys Met Pro Arg Leu Ser Val Glu
530 535 540
Ile Met Asn Asp Pro Gly Arg Ser Cys Pro Leu Asp Ser Leu Pro Asp
545 550 555 560
Glu Thr Pro Val Glu Lys Leu Tyr Val Tyr Arg Thr Ile Ala Gly Pro
565 570 575
Arg Ser Asp Thr Pro Ala Cys Val Gln Ile Val
580 585
<210> 10
<211> 5791
<212> DNA
<213> 水稻TIR1基因组DNA序列(DNA序列)
<400> 10
atggggcgcg gcggctcgcg cgcggcgtgc gccgccgcgg cgccgccgtg gcactcgctc 60
ccggacgagg tctgggagca cgccttctcc ttcctccccg ccgccgcgga caggggcgcc 120
gcggcggggg cgtgcagctc gtggctccgc gccgagcgcc ggtcgcgccg ccgcctcgcc 180
gtcgccaact gctacgccgc cgcgccgcgg gacgccgtcg agcggttccc gtccgtgcgc 240
gccgccgagg tcaagggcaa gccccacttc gccgacttcg gcctcgtccc ccccgcctgg 300
ggcgccgccg cggcgccgtg gatcgccgcc gccgccgacg ggtggccgct gctcgaggag 360
ctcagcttca agcgcatggt cgtcaccgac gagtgcctcg agatgatcgc cgcgtccttc 420
aggaacttcc aggtgctccg cctcgtctcc tgcgacggct tcagcaccgc gggcctcgcc 480
gccattgctg ccggttgcag gtgaggtgga gagtgttgtt tgggtcaaat ctttttagct 540
aaataagcat gggatctttg ggttgttctt ggatttgaga ggaatctttc acggcccaag 600
ctttgattcg tcttcttttt agctaaaaca tgacagattt cttggtgcca tttctttctt 660
cacagtgttc tttagtgagt tcatggtcta gctgaagtga tttgttcttc catgattcct 720
atattaactt tgttttgaac ttcattgagt agtatgtgga agtagatgtg gctttctgct 780
aagatttgat ctattcttgg tgtttaattt gcaaagggac agtttttttt tctgtttact 840
tgtgtatgat ctggatttac ttttggtgtt tcctaagttg aagaccaaga agtcttcttg 900
tgacagtatt ttagatgctt ataacgtgtt aatgtcaaag gaatgattcc catgaaaatt 960
ctgctgtgat ttgtacattt tattaggagt taagtaacag agtgaattga gtgatgctca 1020
cgtcttcttt aaatcttagc tatgatttgt tcctaggaag ctttgacttg tatttgagtg 1080
cctggtttgc gaagatgtga ttctcttgca cggatctgtg tgattgacag aagaaatatt 1140
tctacctgtt taagcaatga tggatccatc tctttgtttc tttttgtgct ttttacccaa 1200
aagaatggga tatttcaagt ttacaaacaa ctggtgatgc gcctttataa ttttgggctt 1260
ttttaaaaga atgtattctt cccatcatga gttactagat ctgagttgaa ctgttttcct 1320
ttatattttc ctgatattta agtgaatttg ttgagttcct atcctgattt gaacttccag 1380
attctaaaga accaggtctt ttaagcatgt ttttgtcatg tagattccca gtttatcccc 1440
tccccctcct tttgtgctca agaatctact accttttatc ttgcttttgg tgagggaaag 1500
tgatttttgc tccaatattt gtgatgtcct catgtaatgg acagttaaaa caaacagatt 1560
tgttcttgcg agtatcttct ggactccccc cagaaaagaa ttaggaatgt gtgggattcc 1620
tatcattggg gaatttatat cctaaaccag atagaaggat ctaatagtgg gagtttcgat 1680
cctgattcat ccattagtag tagtttaata tgccaaagca gtatcatttg catcattttg 1740
aggaactcga aacagttgaa ctgtgaagtt taactactgt acacttcaaa caggcagatt 1800
agaataggtt gtgagataac taaatttggt tcggtgatcg tataaggcca tattcttgga 1860
tattaggacg aaatgagcct gagcaccaca tgtgtacttg ctgatggttg agaacttagc 1920
atagatacta gtttttatgc tagactagag ggctactggt acattcactt gtttgataaa 1980
tccagatgta tttaagtttt gattcaaaat attttgactc tagattggag actacatttt 2040
agagcattca aaatttacaa tggaagcagg attttagcaa aactattttc atacatttac 2100
tctgttattg agccagaatc attttttagt tcttgctact tttttgttaa cactgttatg 2160
catgtaaact cagcgttaca tttatttcaa ttacaaggat ctacacttgt agctctgggt 2220
gcagatggta gttaacattg atgaatctta gctatatcga aatactatct tctaagtaca 2280
aacttttctt gtgtgattct tatccttgtt gttactgttg ctacttatat ccattgattg 2340
agcatgcttt gaattacctt aagaatttct ctctccagtc aaatttattt gactttgaga 2400
gaactgtgtt tatttctccc aacgtcaaat gttttgaatt ttgaatggac agagtatgta 2460
gtagtgggca gcacattggt gccctagctg caaataaaac cttttttttt tgttaaaaca 2520
atgattatga ggatgtcggt ttacactgtc cactcagaaa tttgacttga ttatggatag 2580
ggtacacctt gttgttttag atggttcctt cttaacaaga tgctagattt tgatgatttg 2640
attctttaca aggagtagtc taaaatactg gaagtgtcaa cttaaaaagt tcaaacttgc 2700
cctagccata cgtgatacat tagacaactg atgtgctgtg ttatctgcaa ctgacaatta 2760
ttgttgttgc tatctccttt ttttgcttta gagtaggcag gtattttgtg tcaactaaaa 2820
gtgtgtttca cgtgttgcct ttcttaatac cttttgaata atagggtata agaaaatttt 2880
catgaatggt ttgctttcca attgttgatg ttgctttcct tcaccttatt ttttaaacca 2940
ccatgattaa tctatttatc taggtaatat tgctcatgct gattcatgat acgtggtaaa 3000
aaaataggtc ttttcaactt tcagaggctg ctggactcca tttatttagt tgattttgat 3060
ccctacaccg attttatcca ttggtttata ttcactgcta acatatgata ctcgctatca 3120
tttacttcac tgttgatcat caatgtttta attttgacca ttattaactt ttatatgatt 3180
aatttagtat taatgaaagt tgtgcggttg tatttatggc atgacacaca tttctaacat 3240
ggcatacttt taagcataca taactttttt tgtaaaaagg acaagcgatc aaaggtaaaa 3300
aggtgaatag catacagtga gaagtatttg agaccaaagg gagtataatc attatctact 3360
aaacaaatac aataccattc attataagct gagttcgcat agtgtaattg aaagtgggga 3420
atgctagtat agctcacaca tgaaatcaag tccctgtgaa atgatagtaa accctacgtg 3480
ttcattgttt tagtcttatg atatgttcca gttatgtttg ccatggttgt tgaatgcagt 3540
agtcaaagtt tgcttctgtt tgtttgagtg gattctcatt taccttgcct tttccaccat 3600
atactcatat gggctttgtt tcacaagtga taacattggt taatggctat atgctatcct 3660
tacagtttca ttcttctttt aagatatgag tcaccatgca catttcttca acttctgatt 3720
ttgtctaata ttgcagacac ctaagagaac ttgacctgca agagaacgag attgaggatt 3780
gttctattca ttggctcagc ctcttcccgg aatcgttcac ttctctagta actctaaact 3840
tttcatgctt agagggggag gtcaatatca ctgtacttga acggttagtg accagatgtc 3900
acaacctgaa gactcttaag ctcaacaatg ctatccccct tgacaagctt gctagcctcc 3960
ttcataaggc tcctcagcta gttgaactcg gaactggcaa attctctgct gattaccatt 4020
ccgatctgtt tgcaaagctg gaggcggcgt ttggaggttg taaaagcttg agaaggcttt 4080
ctggggcttg ggatgctgtt ccagattatc tgccagcatt ctattgtgta tgtgaaggcc 4140
tcacatcact taatctgagt tatgctactg tgcgaggtcc tgagctcatc aaattcatta 4200
gtagatgcag aaatttgcaa caattatggg tatgcaactc ttgtcaattc ttttttacta 4260
ctatgtattc atcccattcg aatctgttaa cttttgaaaa actgttgcat atctctttgc 4320
aatacaagca cttgattccc tacaagtgga ttttgcaaat tttttctttt cttctgtgac 4380
ctccagtaaa aaagttcctg atgttttctt acttatcatg gtcactagta aaagtccgac 4440
tacatgtatt cttttttcac aatgtagttt tatcaattat attggtatag ggctgcaata 4500
gcattttatg atgaaactga ctgcactttt cccatgacaa caagaatttg tggcttggaa 4560
taatctattg agtgttaaat catgcatatg tttttcatgt ttgtcaatac agttttgtag 4620
gatgcatgtt acattcaatg gcatgctgtt gggtgcctcc aatgaataga ttgaaattac 4680
cactcttatc ttttggggaa gtaggatatt tatatggaaa aaacatagat gacaatggta 4740
tcctatcctt attagaatca ttgtgaaaag actgccagat gaatccattt gctctagggc 4800
agcattcttt gcctttcttg gcaaactgag ttattgtctg aaccctcata gtttccatcc 4860
tttaactgtt aactgctaga tgagttgctt gctctacggc agatatttta aactgaatta 4920
tgatctgaac cccaatggct attaacctgg tcatgttagc tctttatgca atcttttttc 4980
tctatatttt tcttctaaaa gttaagctgc aatttttcag gtgatggacc tcattgagga 5040
tcatggttta gctgttgtgg catcatcttg caataaactt caagagttgc gggtcttccc 5100
ttctgaccct tttggtgcag gattcttgac tgaaagaggt cttgttgatg tctctgcaag 5160
ttgtccaatg ttggagtcag tgctctactt ctgcagacgg atgacaaatg aggcacttat 5220
taccattgca aagaaccgtc ccaacttcac ttgcttccgc ctatgcatcc ttgagccaca 5280
cactccagac tacatcacac gggagcctct tgatgcaggt ttcagcgcca ttgtggagtc 5340
atgcaggggc cttaggcgtc tctctatctc aggccttctc acagatcttg tgtttaaatc 5400
cattggggca catgctgatc gtcttgagat gctttcaatc gccttcgctg ggaacagcga 5460
cttgggcctg cattacatcc tctcaggctg caagagcctg aagaaactgg agatcaggga 5520
ctgcccattt ggtgataagc cattgctggc gaacgcagca aagctggaga caatgcgatc 5580
cctttggatg tcgtcgtgct tgttgaccct gggcgcatgc cgacagcttg cacgcaagat 5640
gccccgcctt agtgtggaga tcatgaacga tcctggaagg tcatgcccct tggattcgct 5700
tccggatgaa acacctgttg agaaactgta cgtctaccgg acgatcgcag gtccaaggtc 5760
cgacacacca gcctgcgtcc agattgtgta g 5791
<210> 11
<211> 644
<212> PRT
<213> 水稻ALS蛋白氨基酸序列(氨基酸序列)
<400> 11
Met Ala Thr Thr Ala Ala Ala Ala Ala Ala Thr Leu Ser Ala Ala Ala
1 5 10 15
Thr Ala Lys Thr Gly Arg Lys Asn His Gln Arg His His Val Leu Pro
20 25 30
Ala Arg Gly Arg Val Gly Ala Ala Ala Val Arg Cys Ser Ala Val Ser
35 40 45
Pro Val Thr Pro Pro Ser Pro Ala Pro Pro Ala Thr Pro Leu Arg Pro
50 55 60
Trp Gly Pro Ala Glu Pro Arg Lys Gly Ala Asp Ile Leu Val Glu Ala
65 70 75 80
Leu Glu Arg Cys Gly Val Ser Asp Val Phe Ala Tyr Pro Gly Gly Ala
85 90 95
Ser Met Glu Ile His Gln Ala Leu Thr Arg Ser Pro Val Ile Thr Asn
100 105 110
His Leu Phe Arg His Glu Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr
115 120 125
Ala Arg Ala Ser Gly Arg Val Gly Val Cys Val Ala Thr Ser Gly Pro
130 135 140
Gly Ala Thr Asn Leu Val Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser
145 150 155 160
Val Pro Met Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly
165 170 175
Thr Asp Ala Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile
180 185 190
Thr Lys His Asn Tyr Leu Val Leu Asp Val Glu Asp Ile Pro Arg Val
195 200 205
Ile Gln Glu Ala Phe Phe Leu Ala Ser Ser Gly Arg Pro Gly Pro Val
210 215 220
Leu Val Asp Ile Pro Lys Asp Ile Gln Gln Gln Met Ala Val Pro Val
225 230 235 240
Trp Asp Thr Ser Met Asn Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys
245 250 255
Pro Pro Ala Thr Glu Leu Leu Glu Gln Val Leu Arg Leu Val Gly Glu
260 265 270
Ser Arg Arg Pro Ile Leu Tyr Val Gly Gly Gly Cys Ser Ala Ser Gly
275 280 285
Asp Glu Leu Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Thr Thr
290 295 300
Thr Leu Met Gly Leu Gly Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu
305 310 315 320
Arg Met Leu Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp
325 330 335
Lys Ala Asp Leu Leu Leu Ala Phe Gly Val Arg Phe Asp Asp Arg Val
340 345 350
Thr Gly Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Ile
355 360 365
Asp Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser
370 375 380
Ile Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Leu Asn Ala Leu Leu
385 390 395 400
Asp Gln Ser Thr Thr Lys Thr Ser Ser Asp Phe Ser Ala Trp His Asn
405 410 415
Glu Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr Lys Thr Phe
420 425 430
Gly Glu Glu Ile Pro Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu
435 440 445
Thr Lys Gly Glu Ala Ile Ile Ala Thr Gly Val Gly Gln His Gln Met
450 455 460
Trp Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser
465 470 475 480
Ser Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ala Gly
485 490 495
Ala Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile Asp Gly Asp
500 505 510
Gly Ser Phe Leu Met Asn Ile Gln Glu Leu Ala Leu Ile Arg Ile Glu
515 520 525
Asn Leu Pro Val Lys Val Met Val Leu Asn Asn Gln His Leu Gly Met
530 535 540
Val Val Gln Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr
545 550 555 560
Tyr Leu Gly Asn Pro Glu Cys Glu Ser Glu Ile Tyr Pro Asp Phe Val
565 570 575
Thr Ile Ala Lys Gly Phe Asn Ile Pro Ala Val Arg Val Thr Lys Lys
580 585 590
Ser Glu Val Arg Ala Ala Ile Lys Lys Met Leu Glu Thr Pro Gly Pro
595 600 605
Tyr Leu Leu Asp Ile Ile Val Pro His Gln Glu His Val Leu Pro Met
610 615 620
Ile Pro Asn Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp Gly
625 630 635 640
Arg Thr Met Tyr
<210> 12
<211> 1935
<212> DNA
<213> 水稻ALS基因DNA序列(DNA序列)
<400> 12
atggctacga ccgccgcggc cgcggccgcc accttgtccg ccgccgcgac ggccaagacc 60
ggccgtaaga accaccagcg acaccacgtc cttcccgctc gaggccgggt gggggcggcg 120
gcggtcaggt gctcggcggt gtccccggtc accccgccgt ccccggcgcc gccggccacg 180
ccgctccggc cgtgggggcc ggccgagccc cgcaagggcg cggacatcct cgtggaggcg 240
ctggagcggt gcggcgtcag cgacgtgttc gcctacccgg gcggcgcgtc catggagatc 300
caccaggcgc tgacgcgctc cccggtcatc accaaccacc tcttccgcca cgagcagggc 360
gaggcgttcg cggcgtccgg gtacgcgcgc gcgtccggcc gcgtcggggt ctgcgtcgcc 420
acctccggcc ccggggcaac caacctcgtg tccgcgctcg ccgacgcgct gctcgactcc 480
gtcccgatgg tcgccatcac gggccaggtc ccccgccgca tgatcggcac cgacgccttc 540
caggagacgc ccatagtcga ggtcacccgc tccatcacca agcacaatta ccttgtcctt 600
gatgtggagg acatcccccg cgtcatacag gaagccttct tcctcgcgtc ctcgggccgt 660
cctggcccgg tgctggtcga catccccaag gacatccagc agcagatggc tgtgccagtc 720
tgggacacct cgatgaatct accggggtac attgcacgcc tgcccaagcc acccgcgaca 780
gaattgcttg agcaggtctt gcgtctggtt ggcgagtcac ggcgcccgat tctctatgtc 840
ggtggtggct gctctgcatc tggtgatgaa ttgcgccggt ttgttgagct gaccggcatc 900
ccagttacaa ccactctgat gggcctcggc aatttcccca gtgatgatcc gttgtccctg 960
cgcatgcttg ggatgcatgg cacggtgtac gcaaattatg cggtggataa ggctgacctg 1020
ttgcttgcat ttggcgtgcg gtttgatgat cgtgtgacag ggaaaattga ggcttttgca 1080
agcagggcca agattgtgca cattgacatt gatccagcgg agattggaaa gaacaagcaa 1140
ccacatgtgt caatttgcgc agatgttaag cttgctttac agggcttgaa tgctctgcta 1200
gaccagagca caacaaagac aagttctgat tttagtgcat ggcacaatga gttggaccag 1260
cagaagaggg agtttcctct ggggtacaag acttttggtg aagagatccc accgcaatat 1320
gctattcagg tgctggatga gctgacgaaa ggggaggcaa tcatcgctac tggtgttgga 1380
cagcaccaga tgtgggcggc acaatattac acctacaagc ggccacggca gtggctgtct 1440
tcggctggtc tgggcgcaat gggatttggg ctgcctgctg cagctggtgc ttctgtggct 1500
aacccaggtg tcacagttgt tgatattgat ggggatggta gcttcctcat gaacattcag 1560
gagttggcat tgatccgcat tgagaacctc ccggtgaagg tgatggtgtt gaacaaccaa 1620
catttgggta tggttgtgca atgggaggat aggttttaca aggcaaatag ggcgcataca 1680
tacttgggca acccagaatg tgagagcgag atatatccag attttgtgac tattgctaaa 1740
gggttcaata ttcctgcagt ccgtgtaaca aagaagagtg aagtccgtgc cgccatcaag 1800
aagatgctcg agaccccagg gccatacttg ttggatatca tcgtcccaca ccaggagcat 1860
gtgctgccta tgatcccaaa tgggggcgca ttcaaggaca tgatcctgga tggtgatggc 1920
aggactatgt attaa 1935
<210> 13
<211> 2327
<212> PRT
<213> 水稻ACCase2蛋白氨基酸序列(氨基酸序列)
<400> 13
Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro
1 5 10 15
Pro Arg His Gln Lys Lys Ser Ala Gly Thr Ala Phe Val Ser Ser Gly
20 25 30
Ser Ser Arg Pro Ser Tyr Arg Lys Asn Gly Gln Arg Thr Arg Ser Leu
35 40 45
Arg Glu Glu Ser Asn Gly Gly Val Ser Asp Ser Lys Lys Leu Asn His
50 55 60
Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro Asn Asp Ala
65 70 75 80
Ala Ser Glu Val Asp Ile Ser His Gly Ser Glu Asp Pro Arg Gly Pro
85 90 95
Thr Val Pro Gly Ser Tyr Gln Met Asn Gly Ile Ile Asn Glu Thr His
100 105 110
Asn Gly Arg His Ala Ser Val Ser Lys Val Val Glu Phe Cys Thr Ala
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Leu Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met His Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Val Pro Leu Glu Cys
275 280 285
Cys Leu Asp Ser Ile Pro Asp Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Thr Glu Glu Ala Val Ala Ser Cys Gln Val Val Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
His Asn Asp Asp Glu Val Arg Thr Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ala Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Gln Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Trp
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asn
485 490 495
His Gly Gly Gly Tyr Asp Leu Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asp Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Ala Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Thr Thr Arg Ser Ala
580 585 590
Ala Ile Thr Thr Met Ala Leu Ala Leu Lys Glu Val Gln Ile Arg Gly
595 600 605
Glu Ile His Ser Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Ser
610 615 620
Asp Phe Arg Glu Asn Lys Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser
660 665 670
Asp Tyr Val Gly Tyr Leu Thr Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val Tyr Thr Thr Val Ala Leu Asn Ile Asp Gly Lys Lys Tyr
690 695 700
Thr Ile Asp Thr Val Arg Ser Gly His Gly Ser Tyr Arg Leu Arg Met
705 710 715 720
Asn Gly Ser Thr Val Asp Ala Asn Val Gln Ile Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Ser Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Met Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Val Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ser Gly Val Ile His Val Val Met Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Asp Thr Phe Pro Gln Met Gly Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Leu Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Cys Arg Met Ile Leu Ala Gly Tyr Glu His Asp Ile Asp Lys
885 890 895
Val Val Pro Glu Leu Val Tyr Cys Leu Asp Thr Pro Glu Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Asn Leu Lys Ser Glu Leu Glu Gly Lys Tyr Glu Glu Tyr Lys Val Lys
930 935 940
Phe Asp Ser Gly Ile Ile Asn Asp Phe Pro Ala Asn Met Leu Arg Val
945 950 955 960
Ile Ile Glu Glu Asn Leu Ala Cys Gly Ser Glu Lys Glu Lys Ala Thr
965 970 975
Asn Glu Arg Leu Val Glu Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Val Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Tyr Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser Asp
1010 1015 1020
Val Ile Glu Arg Leu Arg Leu Gln His Ser Lys Asp Leu Gln Lys Val
1025 1030 1035 1040
Val Asp Ile Val Leu Ser His Gln Ser Val Arg Asn Lys Thr Lys Leu
1045 1050 1055
Ile Leu Lys Leu Met Glu Ser Leu Val Tyr Pro Asn Pro Ala Ala Tyr
1060 1065 1070
Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn His Lys Ala Tyr Tyr
1075 1080 1085
Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu Glu Gln Thr Lys Leu Ser
1090 1095 1100
Glu Leu Arg Ala Arg Ile Ala Arg Ser Leu Ser Glu Leu Glu Met Phe
1105 1110 1115 1120
Thr Glu Glu Ser Lys Gly Leu Ser Met His Lys Arg Glu Ile Ala Ile
1125 1130 1135
Lys Glu Ser Met Glu Asp Leu Val Thr Ala Pro Leu Pro Val Glu Asp
1140 1145 1150
Ala Leu Ile Ser Leu Phe Asp Cys Ser Asp Thr Thr Val Gln Gln Arg
1155 1160 1165
Val Ile Glu Thr Tyr Ile Ala Arg Leu Tyr Gln Pro His Leu Val Lys
1170 1175 1180
Asp Ser Ile Lys Met Lys Trp Ile Glu Ser Gly Val Ile Ala Leu Trp
1185 1190 1195 1200
Glu Phe Pro Glu Gly His Phe Asp Ala Arg Asn Gly Gly Ala Val Leu
1205 1210 1215
Gly Asp Lys Arg Trp Gly Ala Met Val Ile Val Lys Ser Leu Glu Ser
1220 1225 1230
Leu Ser Met Ala Ile Arg Phe Ala Leu Lys Glu Thr Ser His Tyr Thr
1235 1240 1245
Ser Ser Glu Gly Asn Met Met His Ile Ala Leu Leu Gly Ala Asp Asn
1250 1255 1260
Lys Met His Ile Ile Gln Glu Ser Gly Asp Asp Ala Asp Arg Ile Ala
1265 1270 1275 1280
Lys Leu Pro Leu Ile Leu Lys Asp Asn Val Thr Asp Leu His Ala Ser
1285 1290 1295
Gly Val Lys Thr Ile Ser Phe Ile Val Gln Arg Asp Glu Ala Arg Met
1300 1305 1310
Thr Met Arg Arg Thr Phe Leu Trp Ser Asp Glu Lys Leu Ser Tyr Glu
1315 1320 1325
Glu Glu Pro Ile Leu Arg His Val Glu Pro Pro Leu Ser Ala Leu Leu
1330 1335 1340
Glu Leu Asp Lys Leu Lys Val Lys Gly Tyr Asn Glu Met Lys Tyr Thr
1345 1350 1355 1360
Pro Ser Arg Asp Arg Gln Trp His Ile Tyr Thr Leu Arg Asn Thr Glu
1365 1370 1375
Asn Pro Lys Met Leu His Arg Val Phe Phe Arg Thr Leu Val Arg Gln
1380 1385 1390
Pro Ser Val Ser Asn Lys Phe Ser Ser Gly Gln Ile Gly Asp Met Glu
1395 1400 1405
Val Gly Ser Ala Glu Glu Pro Leu Ser Phe Thr Ser Thr Ser Ile Leu
1410 1415 1420
Arg Ser Leu Met Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg
1425 1430 1435 1440
Thr Gly His Ser His Met Tyr Leu His Val Leu Lys Glu Gln Lys Leu
1445 1450 1455
Leu Asp Leu Val Pro Val Ser Gly Asn Thr Val Leu Asp Val Gly Gln
1460 1465 1470
Asp Glu Ala Thr Ala Tyr Ser Leu Leu Lys Glu Met Ala Met Lys Ile
1475 1480 1485
His Glu Leu Val Gly Ala Arg Met His His Leu Ser Val Cys Gln Trp
1490 1495 1500
Glu Val Lys Leu Lys Leu Asp Cys Asp Gly Pro Ala Ser Gly Thr Trp
1505 1510 1515 1520
Arg Ile Val Thr Thr Asn Val Thr Ser His Thr Cys Thr Val Asp Ile
1525 1530 1535
Tyr Arg Glu Met Glu Asp Lys Glu Ser Arg Lys Leu Val Tyr His Pro
1540 1545 1550
Ala Thr Pro Ala Ala Gly Pro Leu His Gly Val Ala Leu Asn Asn Pro
1555 1560 1565
Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys Arg Cys Ser Ala Arg Asn
1570 1575 1580
Asn Arg Thr Thr Tyr Cys Tyr Asp Phe Pro Leu Ala Phe Glu Thr Ala
1585 1590 1595 1600
Val Arg Lys Ser Trp Ser Ser Ser Thr Ser Gly Ala Ser Lys Gly Val
1605 1610 1615
Glu Asn Ala Gln Cys Tyr Val Lys Ala Thr Glu Leu Val Phe Ala Asp
1620 1625 1630
Lys His Gly Ser Trp Gly Thr Pro Leu Val Gln Met Asp Arg Pro Ala
1635 1640 1645
Gly Leu Asn Asp Ile Gly Met Val Ala Trp Thr Leu Lys Met Ser Thr
1650 1655 1660
Pro Glu Phe Pro Ser Gly Arg Glu Ile Ile Val Val Ala Asn Asp Ile
1665 1670 1675 1680
Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe Phe Glu
1685 1690 1695
Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu Ile Tyr Leu
1700 1705 1710
Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp Glu Val Lys Ser
1715 1720 1725
Cys Phe Arg Val Gly Trp Ser Asp Asp Gly Ser Pro Glu Arg Gly Phe
1730 1735 1740
Gln Tyr Ile Tyr Leu Ser Glu Glu Asp Tyr Ala Arg Ile Gly Thr Ser
1745 1750 1755 1760
Val Ile Ala His Lys Met Gln Leu Asp Ser Gly Glu Ile Arg Trp Val
1765 1770 1775
Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu Gly Val Glu Asn Ile
1780 1785 1790
His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser Arg Ala Tyr Lys Glu
1795 1800 1805
Thr Phe Thr Leu Thr Phe Val Thr Gly Arg Thr Val Gly Ile Gly Ala
1810 1815 1820
Tyr Leu Ala Arg Leu Gly Ile Arg Cys Ile Gln Arg Leu Asp Gln Pro
1825 1830 1835 1840
Ile Ile Leu Thr Gly Tyr Ser Ala Leu Asn Lys Leu Leu Gly Arg Glu
1845 1850 1855
Val Tyr Ser Ser His Met Gln Leu Gly Gly Pro Lys Ile Met Ala Thr
1860 1865 1870
Asn Gly Val Val His Leu Thr Val Ser Asp Asp Leu Glu Gly Val Ser
1875 1880 1885
Asn Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala Tyr Ile Gly Gly Pro
1890 1895 1900
Leu Pro Val Thr Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr
1905 1910 1915 1920
Ile Pro Glu Asn Ser Cys Asp Pro Arg Ala Ala Ile Arg Gly Val Asp
1925 1930 1935
Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys Asp Ser Phe
1940 1945 1950
Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val Thr Gly Arg Ala
1955 1960 1965
Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala Val Glu Thr Gln Thr
1970 1975 1980
Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu Asp Ser Arg Glu
1985 1990 1995 2000
Gln Ser Val Pro Arg Ala Gly Gln Val Trp Phe Pro Asp Ser Ala Thr
2005 2010 2015
Lys Thr Ala Gln Ala Leu Leu Asp Phe Asn Arg Glu Gly Leu Pro Leu
2020 2025 2030
Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Leu
2035 2040 2045
Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr Ile Val Glu Asn Leu Arg
2050 2055 2060
Thr Tyr Asn Gln Pro Ala Phe Val Tyr Ile Pro Met Ala Ala Glu Leu
2065 2070 2075 2080
Arg Gly Gly Ala Trp Val Val Val Asp Ser Lys Ile Asn Pro Asp Arg
2085 2090 2095
Ile Glu Cys Tyr Ala Glu Arg Thr Ala Lys Gly Asn Val Leu Glu Pro
2100 2105 2110
Gln Gly Leu Ile Glu Ile Lys Phe Arg Ser Glu Glu Leu Gln Asp Cys
2115 2120 2125
Met Ser Arg Leu Asp Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu
2130 2135 2140
Val Ala Asn Lys Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn
2145 2150 2155 2160
Ile Glu Ala Arg Thr Lys Gln Leu Met Pro Leu Tyr Thr Gln Ile Ala
2165 2170 2175
Ile Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala Ala Lys
2180 2185 2190
Gly Val Ile Lys Lys Val Val Asp Trp Glu Glu Ser Arg Ser Phe Phe
2195 2200 2205
Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu Ala Lys Glu
2210 2215 2220
Ile Arg Ala Val Ala Gly Glu Gln Phe Ser His Gln Pro Ala Ile Glu
2225 2230 2235 2240
Leu Ile Lys Lys Trp Tyr Ser Ala Ser His Ala Ala Glu Trp Asp Asp
2245 2250 2255
Asp Asp Ala Phe Val Ala Trp Met Asp Asn Pro Glu Asn Tyr Lys Asp
2260 2265 2270
Tyr Ile Gln Tyr Leu Lys Ala Gln Arg Val Ser Gln Ser Leu Ser Ser
2275 2280 2285
Leu Ser Asp Ser Ser Ser Asp Leu Gln Ala Leu Pro Gln Gly Leu Ser
2290 2295 2300
Met Leu Leu Asp Lys Met Asp Pro Ser Arg Arg Ala Gln Leu Val Glu
2305 2310 2315 2320
Glu Ile Arg Lys Val Leu Gly
2325
<210> 14
<211> 11927
<212> DNA
<213> 水稻ACCase2基因组DNA序列(DNA序列)
<400> 14
atgacatcca cacatgtggc gacattggga gttggtgccc aggcacctcc tcgtcaccag 60
aaaaagtcag ctggcactgc atttgtatca tctgggtcat caagaccctc ataccgaaag 120
aatggtcagc gtactcggtc acttagggaa gaaagcaatg gaggagtgtc tgattccaaa 180
aagcttaacc actctattcg ccaaggtgac cactagctac tttacatatg ctataatttg 240
tgccaaacat aaacatgcaa tggctgctat tatttaaacg ttaatgttga aatagctgct 300
ataggataca gcaaaaatat ataattgact gggcaagatg caacaattgt ttttcactaa 360
agttagttat cttttgctgt aaaagacaac tgttttttac ataaaatggt attaataacc 420
ttgtaatatt caatgcaaca tgttctcaag taaaaaaaaa cattgcctgg ttgtataagc 480
aaatgtgtcg ttgtagacat cttattaaac ctttttgtga tatctattac cgtagggaac 540
aggggagctg tttaaatctg ttatcataga gtaatatgag aaaagtggat tgtgcgactt 600
tggcatgtat acctgctcaa tttcaaatat atgtctatgt gcaggtcttg ctggcatcat 660
tgacctccca aatgacgcag cttcagaagt tgatatttca cagtaaggac tttatatttt 720
ataataatta ttatataatt ttctgacatg ttttgagaac ctcaaaacat gtgattgcac 780
cttccttttt tatgtctggt tcagaaactg ataagttttg acagtgttta ggatggatct 840
ttgatgcgca cagtgctttc taatgttttc atttttgaaa gtaatgtttt aggaagaaat 900
atctgattaa atttatactt tatctttaca aaagtcaaat gcgttctgta tcaattgcgg 960
tttgtaatat ggcaagaaca tgctttcaga atttgttcat acaatgcttt ctttctatta 1020
ttatgtagaa caaataccta atactttgtt caccttttat agtggacacc tctcacagct 1080
ttttcagtaa gtgatgcaat tttgtacatt tgtaagatgt gttccagaaa ccttttctcc 1140
tgcaattcta atgtacccac tcaaactggt atcaccaaag atctccatct gattgaaaaa 1200
aagctgcgtg aagtatgctt atttatgcta accatacatg atttatactg ttttatagta 1260
caatgcttat ttatgctaac catacataat tttattctgt tttctagtac attatttgtg 1320
cccctgacca taaatgatcc tttcttttac agtggttccg aagatcccag ggggcctacg 1380
gtcccaggtt cctaccaaat gaatgggatt atcaatgaaa cacataatgg gaggcatgct 1440
tcagtctcca aggttgttga gttttgtacg gcacttggtg gcaaaacacc aattcacagt 1500
gtattagtgg ccaacaatgg aatggcagca gctaagttca tgcggagtgt ccgaacatgg 1560
gctaatgata cttttggatc agagaaggca attcagctga tagctatggc aactccggag 1620
gatctgagga taaatgcaga gcacatcaga attgccgatc aatttgtaga ggtacctggt 1680
ggaacaaaca acaacaacta tgcaaatgtc caactcatag tggaggttag ttcagctcat 1740
ccctcaacac aacattttcg tttctattta agttagggaa aaatctctac gaccctccaa 1800
tttctgaaca tccaattttc accatcaact gcaatcacag atagcagaga gaacaggtgt 1860
ttctgctgtt tggcctggtt ggggtcatgc atctgagaat cctgaacttc cagatgcgct 1920
gactgcaaaa ggaattgttt ttcttgggcc accagcatca tcaatgcatg cattaggaga 1980
caaggttggc tcagctctca ttgctcaagc agctggagtt ccaacacttg cttggagtgg 2040
atcacatgtg agccttgtct tctctttttt agcttatcat cttatctttt cggtgatgca 2100
ttatcccaat gacactaaac cataggtgga agttcctctg gagtgttgct tggactcaat 2160
acctgatgag atgtatagaa aagcttgtgt tactaccaca gaggaagcag ttgcaagttg 2220
tcaggtggtt ggttatcctg ccatgattaa ggcatcttgg ggtggtggtg gtaaaggaat 2280
aaggaaggtt tgttcttctt gtagttatca agagattgtt tggattgcaa gtgtttagtg 2340
cccatagtta actctggtct ttctaacatg agtaactcaa ctttcttgca ggttcataat 2400
gatgatgagg ttaggacatt atttaagcaa gttcaaggcg aagtacctgg ttccccaata 2460
tttatcatga ggctagctgc tcaggtgggg ccttttatgg aagttacacc ttttccctta 2520
atgttgagtt attccggagt tattatggtt atgttctgta tgtttgatct gtaaattatt 2580
gaaattcacc tccattggtt ctccagatta gcagacctac aattctacat atggtttata 2640
ctttataaat actaggattt agggatcttc atatagttta tacatggtat ttagatttca 2700
tttgtaaccc tattgaagac atcctgattg ttgtcttatg tagagtcgac atcttgaagt 2760
tcagttgctt tgtgatcaat atggcaacgt agcagcactt cacagtcgag attgcagtgt 2820
acaacggcga caccaaaagg tctgctgtct cagttaaatc acccctctga atgatctact 2880
tcttgcctgc tgcgttggtc agaggaataa tggttgtatt ctactgaaca gataatcgag 2940
gaaggaccag ttactgttgc tcctcgtgag actgtgaaag agcttgagca ggcagcacgg 3000
aggcttgcta aagctgtggg ttatgttggt gctgctactg ttgaatacct ttacagcatg 3060
gaaactggtg aatattattt tctggaactt aatccacggc tacaggtcgg ctcctttgac 3120
attcttcagg aattaatttc tgttgaccac atgatttaca ttgtcaaatg gtctcacagg 3180
ttgagcatcc tgtcactgag tggatagctg aagtaaattt gcctgcggct caagttgctg 3240
ttggaatggg tatacccctt tggcagattc caggtaatgc ttcttcattt agttcctgct 3300
ctttgttaat tgaatgagct cttatacaga ccatgagaca cattctactg ttaattcata 3360
gtatcccctg acttgttagt gttagagata cagagatgta tcacaaattc attgtatctc 3420
ctcaaggact gtaaaaatcc tataattaaa tttctgaaaa tttgttcttt taagcagaaa 3480
aaaaatctct aaattatctc cctgtataca gagatcaggc gcttctacgg aatgaaccat 3540
ggaggaggct atgacctttg gaggaaaaca gcagctctag cgactccatt taactttgat 3600
gaagtagatt ctaaatggcc aaaaggccac tgcgtagctg ttagaataac tagcgaggat 3660
ccagatgatg ggtttaagcc tactggtgga aaagtaaagg tgcggtttcc tgatgttagg 3720
tgtatgaatt gaacacattg ctatattgca gctagtgaaa tgactggatc atggttctct 3780
tattttcagg agataagttt caagagtaaa ccaaatgttt gggcctattt ctcagtaaag 3840
gtagtcctca atattgttgc actgccacat tatttgagtt gtcctaacaa ttgtgctgca 3900
attgttagtt ttcaactatt tgttgttctg tttggttgac tggtaccctc tctttgcagt 3960
ctggtggagg catccatgaa ttcgctgatt ctcagttcgg tatgtaaagt taaaagagta 4020
atattgtctt tgctatttat gtttgtcctc acttttaaaa gatattgcct tccattacag 4080
gacatgtttt tgcgtatgga actactagat cggcagcaat aactaccatg gctcttgcac 4140
taaaagaggt tcaaattcgt ggagaaattc attcaaacgt agactacaca gttgacctat 4200
taaatgtaag gactaaatat ctgcttattg aaccttgctt tttggttccc taatgccatt 4260
ttagtctggc tactgaagaa cttatccatc atgccatttc tgttatctta aattcaggcc 4320
tcagatttta gagaaaataa gattcatact ggttggctgg ataccaggat agccatgcgt 4380
gttcaagctg agaggcctcc atggtatatt tcagtcgttg gaggggcttt atatgtaaga 4440
caaactatgc cactcattag catttatgtg aagcaaatgc ggaaaacatg atcaatatgt 4500
cgtcttattt aaatttattt atttttgtgc tgcagaaaac agtaactgcc aacacggcca 4560
ctgtttctga ttatgttggt tatcttacca agggccagat tccaccaaag gtactattct 4620
gttttttcag gatatgaatg ctgtttgaat gtgaaaacca ttgaccataa atccttgttt 4680
gcagcatata tcccttgtct atacgactgt tgctttgaat atagatggga aaaaatatac 4740
agtaagtgtg acattcttaa tggggaaact taatttgttg taaataatca atatcatatt 4800
gactcgtgta tgctgcatca tagatcgata ctgtgaggag tggacatggt agctacagat 4860
tgcgaatgaa tggatcaacg gttgacgcaa atgtacaaat attatgtgat ggtgggcttt 4920
taatgcaggt aatatcttct tcctagttaa agaagatata tcttgttcaa agaattctga 4980
ttattgatct tttaatgttt tcagctggat ggaaacagcc atgtaattta tgctgaagaa 5040
gaggccagtg gtacacgact tcttattgat ggaaagacat gcatgttaca ggtaatgata 5100
gccttgttct ttttagttct agtcacggtg tttgcttgct atttgttgta tctatttaat 5160
gcattcacta attactatat tagtttgcat catcaagtta aaatggaact tctttcttgc 5220
agaatgacca tgacccatca aagttattag ctgagacacc atgcaaactt cttcgtttct 5280
tggttgctga tggtgctcat gttgatgctg atgtaccata tgcggaagtt gaggttatga 5340
agatgtgcat gcccctctta tcacccgctt ctggtgtcat acatgttgta atgtctgagg 5400
gccaagcaat gcaggtacat tcctacattc cattcattgt gctgtgctga catgaacatt 5460
tcaagtaaat acctgtaact tgtttattat tctaggctgg tgatcttata gctaggctgg 5520
atcttgatga cccttctgct gttaagagag ctgagccgtt cgaagatact tttccacaaa 5580
tgggtctccc tattgctgct tctggccaag ttcacaaatt atgtgctgca agtctgaatg 5640
cttgtcgaat gatccttgcg gggtatgagc atgatattga caaggtaaac atcatgtcct 5700
cttgtttttt cttttgttta tcatgcattc ttatgttcat catgtcctct ggcaaatcta 5760
gattccgctg tcgtttcaca cagatttttc tcattctcat aatggtgcca aacataaata 5820
tgctgctata ttcatcaatg ttttcactcg atttctaatt ttgcttttga gttttaaact 5880
ttagtacaat ccatatctaa tctcctttgg caacagtgaa tccattatat atatttttat 5940
taaactgctt tctttttcag gttgtgccag agttggtata ctgcctagac actccggagc 6000
ttcctttcct gcagtgggag gagcttatgt ctgttttagc aactagactt ccaagaaatc 6060
ttaaaagtga ggtatattat ggttgacaag atagctagtc tcatgctcta aggacttgta 6120
catttcgcca cataggttaa ttttccatat caagttctaa tgtacgatat aaaagtagta 6180
ctggcctaaa acagtattgg tggttgacta tctttgttgt gtaagatcaa gtatttcttt 6240
ttcatgctta gtttgtcaat acttcacatt tatcactgac ttgtcgagct aaatgagatt 6300
ttatttgatt tctgtgctcc attatttttg tatatatata tatatattta actatgacta 6360
tatgttatgc ctcaaacgtt tcaaactctt tcagttggag ggcaaatatg aggaatacaa 6420
agtaaaattt gactctggga taatcaatga tttccctgcc aatatgctac gagtgataat 6480
tgaggtcagt tattcaattt gttgtgataa tcactgcctt aactgttcgt tcttttaaca 6540
agcggtttta taggaaaatc ttgcatgtgg ttctgagaag gagaaggcta caaatgagag 6600
gcttgttgag cctcttatga gcctactgaa gtcatatgag ggtgggagag aaagtcatgc 6660
tcactttgtt gtcaagtccc tttttgagga gtatctctat gttgaagaat tgttcagtga 6720
tggaattcag gttaacttac ctattcgcat taaacaaatc atcagttgtt ttatgataaa 6780
gtcaaaatgt ttatatttcc cattcttctg tggatcaaat atatcacgga catgatatag 6840
tttccttagg ctatataatg gttcttcatc aaataatatt gcaggaaaca gtatagcaaa 6900
ctatttgtat atactcgaga tggaaattgt tagaaacatc attgactaaa tctgtccttt 6960
gttacgctgt ttttgtagtc tgatgtgatt gagcgtctgc gccttcaaca tagtaaagac 7020
ctacagaagg tcgtagacat tgtgttgtcc caccaggtaa atttcttcat ggtctgatga 7080
cttcactgcg aatggttact gaactgtctt cttgttctga caatgtgact tttctttgta 7140
gagtgttaga aataaaacta agctgatact aaaactcatg gagagtctgg tctatccaaa 7200
tcctgctgcc tacagggatc aattgattcg cttttcttcc cttaatcaca aagcgtatta 7260
caaggtgacc aggataaaca taaataaacg tgaatttttc aatgaccttt tcttctgaca 7320
tctgaatctg atgaatttct tgcatattaa tacagttggc acttaaagct agtgaacttc 7380
ttgaacaaac aaaacttagt gagctccgtg caagaatagc aaggagcctt tcagagctgg 7440
agatgtttac tgaggaaagc aagggtctct ccatgcataa gcgagaaatt gccattaagg 7500
agagcatgga agatttagtc actgctccac tgccagttga agatgcgctc atttctttat 7560
ttgattgtag tgatacaact gttcaacaga gagtgattga gacttatata gctcgattat 7620
accaggtatg agaagaaaga ccttttgaaa ttatttatat taacatatcc tagtaaaaca 7680
gcatgctcat catttcttaa aaaaagttta cagcacctga tgtttggtta ctgaccgcat 7740
cattaaaata aagttacttg ttgtggagag atgtattttg gaacttgtgg cacatgcagt 7800
aacatgctac tgctcgatat gtttgctaac ttgacaacaa tatttttcag cctcatcttg 7860
taaaggacag tatcaaaatg aaatggatag aatcgggtgt tattgcttta tgggaatttc 7920
ctgaagggca ttttgatgca agaaatggag gagcggttct tggtgacaaa agatggggtg 7980
ccatggtcat tgtcaagtct cttgaatcac tttcaatggc cattagattt gcactaaagg 8040
agacatcaca ctacactagc tctgagggca atatgatgca tattgctttg ttgggtgctg 8100
ataataagat gcatataatt caagaaaggt atgttcatat gctatgttgg tgctgaaata 8160
gttatatatg tagttagctg gtggagttct ggtaattaac ctatcccatt gttcagtggt 8220
gatgatgctg acagaatagc caaacttccc ttgatactaa aggataatgt aaccgatctg 8280
catgcctctg gtgtgaaaac aataagtttc attgttcaaa gagatgaagc acggatgaca 8340
atgcgtcgta ccttcctttg gtctgatgaa aagctttctt atgaggaaga gccaattctc 8400
cggcatgtgg aacctcctct ttctgcactt cttgagttgg tacgtgatat catcaaaatg 8460
ataatgtttt ggtatggcat tgattatctt ctatgctctt tgtatttatt cagcctattg 8520
tggatacagg acaagttgaa agtgaaagga tacaatgaaa tgaagtatac cccatcacgg 8580
gatcgtcaat ggcatatcta cacacttaga aatactgaaa accccaaaat gttgcaccgg 8640
gtatttttcc gaacccttgt caggcaaccc agtgtatcca acaagttttc ttcgggccag 8700
attggtgaca tggaagttgg gagtgctgaa gaacctctgt catttacatc aaccagcata 8760
ttaagatctt tgatgactgc tatagaggaa ttggagcttc acgcaattag aactggccat 8820
tcacacatgt atttgcatgt attgaaagaa caaaagcttc ttgatcttgt tccagtttca 8880
gggtaagtgc gcatatttct ttttgggaac atatgcttgc ttatgaggtt ggtcttctca 8940
atgatcttct tatcttactc aggaatacag ttttggatgt tggtcaagat gaagctactg 9000
catattcact tttaaaagaa atggctatga agatacatga acttgttggt gcaagaatgc 9060
accatctttc tgtatgccaa tgggaagtga aacttaagtt ggactgcgat ggtcctgcca 9120
gtggtacctg gaggattgta acaaccaatg ttactagtca cacttgcact gtggatgtaa 9180
gtttaatcct ctagcatttt gttttctttg gaaaagcatg tgattttaag ccggctggtc 9240
ctcataccca gacctagtga tctttatata gtgtagacat ttttctaact gcttttaatt 9300
gttttagatc taccgtgaga tggaagataa agaatcacgg aagttagtat accatcccgc 9360
cactccggcg gctggtcctc tgcatggtgt ggcactgaat aatccatatc agcctttgag 9420
tgtcattgat ctcaaacgct gttctgctag gaataataga actacatact gctatgattt 9480
tccactggtg agttgactgc tcccttatat tcaatgcatt accatagcaa attcatattc 9540
gttcatgttg tcaaaataag ccgatgaaaa ttcaaaactg taggcatttg aaactgcagt 9600
gaggaagtca tggtcctcta gtacctctgg tgcttctaaa ggtgttgaaa atgcccaatg 9660
ttatgttaaa gctacagagt tggtatttgc ggacaaacat gggtcatggg gcactccttt 9720
agttcaaatg gaccggcctg ctgggctcaa tgacattggt atggtagctt ggaccttgaa 9780
gatgtccact cctgaatttc ctagtggtag ggagattatt gttgttgcaa atgatattac 9840
gttcagagct ggatcatttg gcccaaggga agatgcattt tttgaagctg ttaccaacct 9900
agcctgtgag aagaaacttc ctcttattta tttggcagca aattctggtg ctcgaattgg 9960
catagcagat gaagtgaaat cttgcttccg tgttgggtgg tctgatgatg gcagccctga 10020
acgtgggttt cagtacattt atctaagcga agaagactat gctcgtattg gcacttctgt 10080
catagcacat aagatgcagc tagacagtgg tgaaattagg tgggttattg attctgttgt 10140
gggcaaggaa gatggacttg gtgtggagaa tatacatgga agtgctgcta ttgccagtgc 10200
ttattctagg gcatataagg agacatttac acttacattt gtgactggaa gaactgttgg 10260
aataggagct tatcttgctc gacttggcat ccggtgcata cagcgtcttg accagcctat 10320
tattcttaca ggctattctg cactgaacaa gcttcttggg cgggaagtgt acagctccca 10380
catgcagttg ggtggtccca aaatcatggc aactaatggt gttgtccatc ttactgtttc 10440
agatgacctt gaaggcgttt ctaatatatt gaggtggctc agttatgttc ctgcctacat 10500
tggtggacca cttccagtaa caacaccgtt ggacccaccg gacagacctg ttgcatacat 10560
tcctgagaac tcgtgtgatc ctcgagcggc tatccgtggt gttgatgaca gccaagggaa 10620
atggttaggt ggtatgtttg ataaagacag ctttgtggaa acatttgaag gttgggctaa 10680
gacagtggtt actggcagag caaagcttgg tggaattcca gtgggtgtga tagctgtgga 10740
gactcagacc atgatgcaaa ctatccctgc tgaccctggt cagcttgatt cccgtgagca 10800
atctgttcct cgtgctggac aagtgtggtt tccagattct gcaaccaaga ctgcgcaggc 10860
attgctggac ttcaaccgtg aaggattacc tctgttcatc ctcgctaact ggagaggctt 10920
ctctggtgga caaagagatc tttttgaagg aattcttcag gctggctcga ctattgttga 10980
gaaccttagg acatacaatc agcctgcctt tgtctacatt cccatggctg cagagctacg 11040
aggaggggct tgggttgtgg ttgatagcaa gataaaccca gaccgcattg agtgctatgc 11100
tgagaggact gcaaaaggca atgttctgga accgcaaggg ttaattgaga tcaagttcag 11160
gtcagaggaa ctccaggatt gcatgagtcg gcttgaccca acattaattg atctgaaagc 11220
aaaactcgaa gtagcaaata aaaatggaag tgctgacaca aaatcgcttc aagaaaatat 11280
agaagctcga acaaaacagt tgatgcctct atatactcag attgcgatac ggtttgctga 11340
attgcatgat acatccctca gaatggctgc gaaaggtgtg attaagaaag ttgtggactg 11400
ggaagaatca cgatctttct tctataagag attacggagg aggatctctg aggatgttct 11460
tgcaaaagaa attagagctg tagcaggtga gcagttttcc caccaaccag caatcgagct 11520
gatcaagaaa tggtattcag cttcacatgc agctgaatgg gatgatgacg atgcttttgt 11580
tgcttggatg gataaccctg aaaactacaa ggattatatt caatatctta aggctcaaag 11640
agtatcccaa tccctctcaa gtctttcaga ttccagctca gatttgcaag ccctgccaca 11700
gggtctttcc atgttactag ataaggtaat tagcttactg atgcttatat aaattctttt 11760
tcattacata tggctggaga actatctaat caaataatga ttataattcc aatcgttctt 11820
tttatgccat tatgatcttc tgaaatttcc ttctttggac acttattcag atggatccct 11880
ctagaagagc tcaacttgtt gaagaaatca ggaaggtcct tggttga 11927
<210> 15
<211> 4203
<212> DNA
<213> SpCas9 DNA序列(DNA序列)
<400> 15
atggctccga agaagaagag gaaggttggc atccacgggg tgccagctgc tgacaagaag 60
tactcgatcg gcctcgatat tgggactaac tctgttggct gggccgtgat caccgacgag 120
tacaaggtgc cctcaaagaa gttcaaggtc ctgggcaaca ccgatcggca ttccatcaag 180
aagaatctca ttggcgctct cctgttcgac agcggcgaga cggctgaggc tacgcggctc 240
aagcgcaccg cccgcaggcg gtacacgcgc aggaagaatc gcatctgcta cctgcaggag 300
attttctcca acgagatggc gaaggttgac gattctttct tccacaggct ggaggagtca 360
ttcctcgtgg aggaggataa gaagcacgag cggcatccaa tcttcggcaa cattgtcgac 420
gaggttgcct accacgagaa gtaccctacg atctaccatc tgcggaagaa gctcgtggac 480
tccacagata aggcggacct ccgcctgatc tacctcgctc tggcccacat gattaagttc 540
aggggccatt tcctgatcga gggggatctc aacccggaca atagcgatgt tgacaagctg 600
ttcatccagc tcgtgcagac gtacaaccag ctcttcgagg agaaccccat taatgcgtca 660
ggcgtcgacg cgaaggctat cctgtccgct aggctctcga agtctcggcg cctcgagaac 720
ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcgggaatct cattgcgctc 780
agcctggggc tcacgcccaa cttcaagtcg aatttcgatc tcgctgagga cgccaagctg 840
cagctctcca aggacacata cgacgatgac ctggataacc tcctggccca gatcggcgat 900
cagtacgcgg acctgttcct cgctgccaag aatctgtcgg acgccatcct cctgtctgat 960
attctcaggg tgaacaccga gattacgaag gctccgctct cagcctccat gatcaagcgc 1020
tacgacgagc accatcagga tctgaccctc ctgaaggcgc tggtcaggca gcagctcccc 1080
gagaagtaca aggagatctt cttcgatcag tcgaagaacg gctacgctgg gtacattgac 1140
ggcggggcct ctcaggagga gttctacaag ttcatcaagc cgattctgga gaagatggac 1200
ggcacggagg agctgctggt gaagctcaat cgcgaggacc tcctgaggaa gcagcggaca 1260
ttcgataacg gcagcatccc acaccagatt catctcgggg agctgcacgc tatcctgagg 1320
aggcaggagg acttctaccc tttcctcaag gataaccgcg agaagatcga gaagattctg 1380
actttcagga tcccgtacta cgtcggccca ctcgctaggg gcaactcccg cttcgcttgg 1440
atgacccgca agtcagagga gacgatcacg ccgtggaact tcgaggaggt ggtcgacaag 1500
ggcgctagcg ctcagtcgtt catcgagagg atgacgaatt tcgacaagaa cctgccaaat 1560
gagaaggtgc tccctaagca ctcgctcctg tacgagtact tcacagtcta caacgagctg 1620
actaaggtga agtatgtgac cgagggcatg aggaagccgg ctttcctgtc tggggagcag 1680
aagaaggcca tcgtggacct cctgttcaag accaaccgga aggtcacggt taagcagctc 1740
aaggaggact acttcaagaa gattgagtgc ttcgattcgg tcgagatctc tggcgttgag 1800
gaccgcttca acgcctccct ggggacctac cacgatctcc tgaagatcat taaggataag 1860
gacttcctgg acaacgagga gaatgaggat atcctcgagg acattgtgct gacactcact 1920
ctgttcgagg accgggagat gatcgaggag cgcctgaaga cttacgccca tctcttcgat 1980
gacaaggtca tgaagcagct caagaggagg aggtacaccg gctgggggag gctgagcagg 2040
aagctcatca acggcattcg ggacaagcag tccgggaaga cgatcctcga cttcctgaag 2100
agcgatggct tcgcgaaccg caatttcatg cagctgattc acgatgacag cctcacattc 2160
aaggaggata tccagaaggc tcaggtgagc ggccaggggg actcgctgca cgagcatatc 2220
gcgaacctcg ctggctcgcc agctatcaag aaggggattc tgcagaccgt gaaggttgtg 2280
gacgagctgg tgaaggtcat gggcaggcac aagcctgaga acatcgtcat tgagatggcc 2340
cgggagaatc agaccacgca gaagggccag aagaactcac gcgagaggat gaagaggatc 2400
gaggagggca ttaaggagct ggggtcccag atcctcaagg agcacccggt ggagaacacg 2460
cagctgcaga atgagaagct ctacctgtac tacctccaga atggccgcga tatgtatgtg 2520
gaccaggagc tggatattaa caggctcagc gattacgacg tcgatcatat cgttccacag 2580
tcattcctga aggatgactc cattgacaac aaggtcctca ccaggtcgga caagaaccgg 2640
ggcaagtctg ataatgttcc ttcagaggag gtcgttaaga agatgaagaa ctactggcgc 2700
cagctcctga atgccaagct gatcacgcag cggaagttcg ataacctcac aaaggctgag 2760
aggggcgggc tctctgagct ggacaaggcg ggcttcatca agaggcagct ggtcgagaca 2820
cggcagatca ctaagcacgt tgcgcagatt ctcgactcac ggatgaacac taagtacgat 2880
gagaatgaca agctgatccg cgaggtgaag gtcatcaccc tgaagtcaaa gctcgtctcc 2940
gacttcagga aggatttcca gttctacaag gttcgggaga tcaacaatta ccaccatgcc 3000
catgacgcgt acctgaacgc ggtggtcggc acagctctga tcaagaagta cccaaagctc 3060
gagagcgagt tcgtgtacgg ggactacaag gtttacgatg tgaggaagat gatcgccaag 3120
tcggagcagg agattggcaa ggctaccgcc aagtacttct tctactctaa cattatgaat 3180
ttcttcaaga cagagatcac tctggccaat ggcgagatcc ggaagcgccc cctcatcgag 3240
acgaacggcg agacggggga gatcgtgtgg gacaagggca gggatttcgc gaccgtcagg 3300
aaggttctct ccatgccaca agtgaatatc gtcaagaaga cagaggtcca gactggcggg 3360
ttctctaagg agtcaattct gcctaagcgg aacagcgaca agctcatcgc ccgcaagaag 3420
gactgggatc cgaagaagta cggcgggttc gacagcccca ctgtggccta ctcggtcctg 3480
gttgtggcga aggttgagaa gggcaagtcc aagaagctca agagcgtgaa ggagctgctg 3540
gggatcacga ttatggagcg ctccagcttc gagaagaacc cgatcgattt cctggaggcg 3600
aagggctaca aggaggtgaa gaaggacctg atcattaagc tccccaagta ctcactcttc 3660
gagctggaga acggcaggaa gcggatgctg gcttccgctg gcgagctgca gaaggggaac 3720
gagctggctc tgccgtccaa gtatgtgaac ttcctctacc tggcctccca ctacgagaag 3780
ctcaagggca gccccgagga caacgagcag aagcagctgt tcgtcgagca gcacaagcat 3840
tacctcgacg agatcattga gcagatttcc gagttctcca agcgcgtgat cctggccgac 3900
gcgaatctgg ataaggtcct ctccgcgtac aacaagcacc gcgacaagcc aatcagggag 3960
caggctgaga atatcattca tctcttcacc ctgacgaacc tcggcgcccc tgctgctttc 4020
aagtacttcg acacaactat cgatcgcaag aggtacacaa gcactaagga ggtcctggac 4080
gcgaccctca tccaccagtc gattaccggc ctctacgaga cgcgcatcga cctgtctcag 4140
ctcgggggcg acaagcggcc agcggcgacg aagaaggcgg ggcaggcgaa gaagaagaag 4200
tga 4203
<210> 16
<211> 4203
<212> DNA
<213> NGA-Cas9 DNA序列(DNA序列)
<400> 16
atggctccga agaagaagag gaaggttggc atccacgggg tgccagctgc tgacaagaag 60
tactcgatcg gcctcgatat tgggactaac tctgttggct gggccgtgat caccgacgag 120
tacaaggtgc cctcaaagaa gttcaaggtc ctgggcaaca ccgatcggca ttccatcaag 180
aagaatctca ttggcgctct cctgttcgac agcggcgaga cggctgaggc tacgcggctc 240
aagcgcaccg cccgcaggcg gtacacgcgc aggaagaatc gcatctgcta cctgcaggag 300
attttctcca acgagatggc gaaggttgac gattctttct tccacaggct ggaggagtca 360
ttcctcgtgg aggaggataa gaagcacgag cggcatccaa tcttcggcaa cattgtcgac 420
gaggttgcct accacgagaa gtaccctacg atctaccatc tgcggaagaa gctcgtggac 480
tccacagata aggcggacct ccgcctgatc tacctcgctc tggcccacat gattaagttc 540
aggggccatt tcctgatcga gggggatctc aacccggaca atagcgatgt tgacaagctg 600
ttcatccagc tcgtgcagac gtacaaccag ctcttcgagg agaaccccat taatgcgtca 660
ggcgtcgacg cgaaggctat cctgtccgct aggctctcga agtctcggcg cctcgagaac 720
ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcgggaatct cattgcgctc 780
agcctggggc tcacgcccaa cttcaagtcg aatttcgatc tcgctgagga cgccaagctg 840
cagctctcca aggacacata cgacgatgac ctggataacc tcctggccca gatcggcgat 900
cagtacgcgg acctgttcct cgctgccaag aatctgtcgg acgccatcct cctgtctgat 960
attctcaggg tgaacaccga gattacgaag gctccgctct cagcctccat gatcaagcgc 1020
tacgacgagc accatcagga tctgaccctc ctgaaggcgc tggtcaggca gcagctcccc 1080
gagaagtaca aggagatctt cttcgatcag tcgaagaacg gctacgctgg gtacattgac 1140
ggcggggcct ctcaggagga gttctacaag ttcatcaagc cgattctgga gaagatggac 1200
ggcacggagg agctgctggt gaagctcaat cgcgaggacc tcctgaggaa gcagcggaca 1260
ttcgataacg gcagcatccc acaccagatt catctcgggg agctgcacgc tatcctgagg 1320
aggcaggagg acttctaccc tttcctcaag gataaccgcg agaagatcga gaagattctg 1380
actttcagga tcccgtacta cgtcggccca ctcgctaggg gcaactcccg cttcgcttgg 1440
atgacccgca agtcagagga gacgatcacg ccgtggaact tcgaggaggt ggtcgacaag 1500
ggcgctagcg ctcagtcgtt catcgagagg atgacgaatt tcgacaagaa cctgccaaat 1560
gagaaggtgc tccctaagca ctcgctcctg tacgagtact tcacagtcta caacgagctg 1620
actaaggtga agtatgtgac cgagggcatg aggaagccgg ctttcctgtc tggggagcag 1680
aagaaggcca tcgtggacct cctgttcaag accaaccgga aggtcacggt taagcagctc 1740
aaggaggact acttcaagaa gattgagtgc ttcgattcgg tcgagatctc tggcgttgag 1800
gaccgcttca acgcctccct ggggacctac cacgatctcc tgaagatcat taaggataag 1860
gacttcctgg acaacgagga gaatgaggat atcctcgagg acattgtgct gacactcact 1920
ctgttcgagg accgggagat gatcgaggag cgcctgaaga cttacgccca tctcttcgat 1980
gacaaggtca tgaagcagct caagaggagg aggtacaccg gctgggggag gctgagcagg 2040
aagctcatca acggcattcg ggacaagcag tccgggaaga cgatcctcga cttcctgaag 2100
agcgatggct tcgcgaaccg caatttcatg cagctgattc acgatgacag cctcacattc 2160
aaggaggata tccagaaggc tcaggtgagc ggccaggggg actcgctgca cgagcatatc 2220
gcgaacctcg ctggctcgcc agctatcaag aaggggattc tgcagaccgt gaaggttgtg 2280
gacgagctgg tgaaggtcat gggcaggcac aagcctgaga acatcgtcat tgagatggcc 2340
cgggagaatc agaccacgca gaagggccag aagaactcac gcgagaggat gaagaggatc 2400
gaggagggca ttaaggagct ggggtcccag atcctcaagg agcacccggt ggagaacacg 2460
cagctgcaga atgagaagct ctacctgtac tacctccaga atggccgcga tatgtatgtg 2520
gaccaggagc tggatattaa caggctcagc gattacgacg tcgatcatat cgttccacag 2580
tcattcctga aggatgactc cattgacaac aaggtcctca ccaggtcgga caagaaccgg 2640
ggcaagtctg ataatgttcc ttcagaggag gtcgttaaga agatgaagaa ctactggcgc 2700
cagctcctga atgccaagct gatcacgcag cggaagttcg ataacctcac aaaggctgag 2760
aggggcgggc tctctgagct ggacaaggcg ggcttcatca agaggcagct ggtcgagaca 2820
cggcagatca ctaagcacgt tgcgcagatt ctcgactcac ggatgaacac taagtacgat 2880
gagaatgaca agctgatccg cgaggtgaag gtcatcaccc tgaagtcaaa gctcgtctcc 2940
gacttcagga aggatttcca gttctacaag gttcgggaga tcaacaatta ccaccatgcc 3000
catgacgcgt acctgaacgc ggtggtcggc acagctctga tcaagaagta cccaaagctc 3060
gagagcgagt tcgtgtacgg ggactacaag gtttacgatg tgaggaagat gatcgccaag 3120
tcggagcagg agattggcaa ggctaccgcc aagtacttct tctactctaa cattatgaat 3180
ttcttcaaga cagagatcac tctggccaat ggcgagatcc ggaagcgccc cctcatcgag 3240
acgaacggcg agacggggga gatcgtgtgg gacaagggca gggatttcgc gaccgtcagg 3300
aaggttctct ccatgccaca agtgaatatc gtcaagaaga cagaggtcca gactggcggg 3360
ttctctaagg agtcaattct gcctaagcgg aacagcgaca agctcatcgc ccgcaagaag 3420
gactgggatc cgaagaagta cggcgggttc gtcagcccca ctgtggccta ctcggtcctg 3480
gttgtggcga aggttgagaa gggcaagtcc aagaagctca agagcgtgaa ggagctgctg 3540
gggatcacga ttatggagcg ctccagcttc gagaagaacc cgatcgattt cctggaggcg 3600
aagggctaca aggaggtgaa gaaggacctg atcattaagc tccccaagta ctcactcttc 3660
gagctggaga acggcaggaa gcggatgctg gcttccgctg gcgagctgca gaaggggaac 3720
gagctggctc tgccgtccaa gtatgtgaac ttcctctacc tggcctccca ctacgagaag 3780
ctcaagggca gccccgagga caacgagcag aagcagctgt tcgtcgagca gcacaagcat 3840
tacctcgacg agatcattga gcagatttcc gagttctcca agcgcgtgat cctggccgac 3900
gcgaatctgg ataaggtcct ctccgcgtac aacaagcacc gcgacaagcc aatcagggag 3960
caggctgaga atatcattca tctcttcacc ctgacgaacc tcggcgcccc tgctgctttc 4020
aagtacttcg acacaactat cgatcgcaag cagtaccgga gcactaagga ggtcctggac 4080
gcgaccctca tccaccagtc gattaccggc ctctacgaga cgcgcatcga cctgtctcag 4140
ctcgggggcg acaagcggcc agcggcgacg aagaaggcgg ggcaggcgaa gaagaagaag 4200
tga 4203
<210> 17
<211> 5860
<212> DNA
<213> 水稻OsBADH2基因组DNA序列(DNA序列)
<400> 17
atggccacgg cgatcccgca gcggcagctc ttcgtcgccg gcgagtggcg cgcccccgcg 60
ctcggccgcc gcctccccgt cgtcaacccc gccaccgagt cccccatcgg taccctcctc 120
ttcaccctct ccaccctctg cttctgcctc tgattagcct ttttgttgtt gttgttgttg 180
ctgctgtttt ttgcgtgtcg gtgcgcaggc gagatcccgg cgggcacggc ggaggacgtg 240
gacgcggcgg tggcggcggc gcgggaggcg ctgaagagga accggggccg cgactgggcg 300
cgcgcgccgg gcgccgtccg ggccaagtac ctccgcgcaa tcgcggccaa ggtagggtgg 360
tgactacccc cacccccccc ccccccccca acgcgacccg cgtgcgtgtg ttccgtacag 420
ggggaggagc tccgcgtggc tctccagtag gtttttgagc cccaaatcga tcgatatgct 480
ctagttttaa gtttgctgct taaattcctc aagggtttag tttgcaacca aatccttatt 540
ttagcttcgg tataagcccc ccatatgatg tgcgtgcgtc ggcatcggaa gtgcgtatcc 600
tctgttctgg actaggaatt ggccataggt tgatcgacag ttcgagtatt ctgcttctgt 660
ttggaataag ttggaagcat ggctgattgt gtatctggat gctgtttttg tggtgattcg 720
tttcaagctc ttgttaattg atgggttcaa gcggagaggg tgcgcaacaa caagtgtata 780
tggctcacgg ccatgggtgt gcacatttga ttggtgcgca acaacaagtg tatattgttt 840
gtgtgcttcg ttagttggca ggtcctagtc actaaatcac tattggattg gtactagtta 900
cttttgtgcc ttgacgatgg gactggatta ctagcctttt ggttgccttt gtggtattcc 960
gttgttatgg gcctgttgat ggatggatcc ctttaatttc tagtgccaaa tgcatgctag 1020
atttctcaca gtttttctct tcaggttata tttctcgtat ttccttttcc taaaggattg 1080
ctttttcatg tattttctgg catatatagg ttattattat tattattctc cagaacaaga 1140
ttacccatat tatggatcac tagtgtacac ttttttggat gaaaaaccta cttactgaaa 1200
gtaaaacagt gaccagtgca cactttactt gaactgtcaa accatcaatt ttctagcaaa 1260
gcaggggatg ctagccttcc agtctaaatg acagtaaact actatacttt tgtccgtagg 1320
tttggaaata tgctaatttc tatcataaaa attttcatgg catatgcgag cattttatga 1380
tcaccttttc cctttttctt cagataatcg agaggaaatc tgagctggct agactagaga 1440
cgcttgattg tgggaagcct cttgatgaag cagcatggga catggtatgt ggccagttat 1500
ccactgtatg aatatgtagt tgcctacaca gcaatctttc ctgaacatga atcctgatgt 1560
atgatattcc atttgtcagg acgatgttgc tggatgcttt gagtactttg cagatcttgc 1620
agaatccttg gacaaaaggc aaaatgcacc tgtctctctt ccaatggaaa actttaaatg 1680
ctatcttcgg aaagagccta tcggtgtagt tgggttgatc acaccttggt atttcacatt 1740
tttctctcat cctgcgctta tatttattta tgacccaagc atggtactaa atagtactag 1800
taacatgcat atactgaatg agtttacaac tttacatgat ttttttgaac tatgaaagtt 1860
gaagacattt gagattttat tcctcttctc ttgtgcaaac atattattgt ctcacaaatt 1920
gtacctagca gctactctct ccgtttcata ttataagtcg tttgactttt ttcctagtca 1980
aaatgtgtta agtttgacca agtttataga aaaatttagc aacatctaaa atatcaaagt 2040
catgttttag tgttttttca ggctctcatg taagcaattt tgatgtgccc tctcctttct 2100
tcttaatata atgatacaca gctcttgtgt attcaaagga aaatatatat atatataatg 2160
atacacacct ctcctccgtg ttaatgcagc tcatttgttc tgtcccggtt caaatatcta 2220
tttttctcat atgttgtcag catgattcac ttaatttagt atatagaaga tgccattatt 2280
tatgtctgga atcttactgc agaagggaaa acaattgata acggaattga ttgcattcta 2340
atttgttgtt tctttgttat gttcttatcg acaattacaa atttgattct gagaatcatg 2400
ttcgggatgt gtatttctac tgcaggaact atcctctcct gatggcaaca tggaaggtag 2460
ctcctgccct ggctgctggc tgtacagctg tactaaaacc atctgaattg gcttccgtgt 2520
aagtttaaca tgttaacttg ttaatgtcat acccatgcta gttgcaatga catttgattt 2580
taaaatgttg tggcatgtcc atgctgcaag caatgtaatt tgaaatctct ctctatcatt 2640
aattaccagg acttgtttgg agcttgctga tgtgtgtaaa gaggttggtc ttccttcagg 2700
tgtgctaaac atagtgactg gattaggttc tgaagccggt gctcctttgt catcacaccc 2760
tggtgtagac aaggtacagc tattcctcct gtaatcatgt ataccccatc aatggaaatg 2820
atattcctct caatacatgg tttatgtttt ctgttaggtt gcatttactg ggagttatga 2880
aactggtaaa aagattatgg cttcagctgc tcctatggtt aaggtttgtt tccaaatttc 2940
tgtggatatt ttttgttctc tttctactaa ctctctatta tcaattctca atgttgtcct 3000
tttcttttaa ctcctttact ttttagaatt gtgatcaaga cactttgagc atcattctag 3060
tagccagttc tatcctgttt cttacctttt tatggttcgt cttttcttga cagcctgttt 3120
cactggaact tggtggaaaa agtcctatag tggtgtttga tgatgttgat gttgaaaaag 3180
gtacatgcca cttgctatga ttaactaatt ctgaagtgcg ggactttgta aagcacttaa 3240
ctgagctgga tgctagaccc ccaaaagccc tttttggtgt cttgggcttg ttgcagaaat 3300
actggtccca gacgagcagg atgcaagaaa attaactact tttgccactg attagtattt 3360
cttagaagtt acacctcaag gattagcaat actttcttaa aatgtgctat tgattaaaaa 3420
gatgtcctgt attattttga gcagatcttg tactggttga tcggcttgca tgaaaatatt 3480
gttgaggatt ataatgccat gccaactgag taaagaaaag agttgtaaaa tatgttatgc 3540
aacatgaata tatatgtgat ttcatttttc ctttttcttt tcgtggcaag gaaggcagtt 3600
aggaaggact gatgtgaaaa gcacaagtac tattcttagt tctggaaaac tgtgttcttt 3660
attttcctaa ctacaattca ccttgattag tcagtaactt gatattggca attctagctg 3720
attatgaatt ctgtttatat ttcactaatt ttgaatcttt aattacattt tatggttgaa 3780
atttaacgtt ttgtctggtt atggactctg tttgtattca ctcaatttgg atcttccatt 3840
agatttcatt gttggtcctt cttcttgtac agctgttgag tggactctct ttggttgctt 3900
ttggaccaat ggccagattt gcagtgcaac atcgcgtctt attcttcatg taagcattga 3960
atatatccgt caatcataat ctattgttgt acttgatttt ttttctgatc aactcctgag 4020
ttcagattat tatatgatgc cattactatt gcacagagcg aataaaattg tatttatgca 4080
cagcatgtat tttgagtaat atatgcattg cctattattt aatatataga ttgtagcact 4140
taattttgtg tccatgtctc tatgatgttt attactttat tattgccggc atgaagcaac 4200
tttgaactct atgttgatct tgaactaaaa ttgaaattaa ttggcttatt gctattaatg 4260
atatagcttt cagcttcttg ctcctgacca tgaaagtttt gcagaaaaaa atcgctaaag 4320
aatttcaaga aaggatggtt gcatgggcca aaaatattaa ggtgtcagat ccacttgaag 4380
agggttgcag gcttgggccc gttgttagtg aaggacaggt accacatgta aactttttct 4440
aaattcaaaa aagaaatgcc actgatcaat ggtaggtcct tccaagcctt attgctggat 4500
tgttgcactg ttttgtcaat tttgtgtaat atagttctga atgaattagt cggtgtatgc 4560
tcttgctagt tgctagtatg tggtacaggg tcttcctact ttgagcaaat tcgtgttaaa 4620
atgcattgat gaaaaggcca cctttccgta ggtttatctt gtcataattt aaaccccaat 4680
aaaattttaa ttttttgttt tgaccccatg gcactttaat gaaatcactt agccatgagc 4740
ttttgtatat attttcaaag caccagaatg tttagatggt ttgttggaaa tcttacacat 4800
cctattgcct tgtgtcagta tgagaagatt aagcaatttg tatctaccgc caaaagccaa 4860
ggtgctacca ttctgactgg tggggttaga cccaaggtaa taatctacta cacggttgta 4920
tatataggta cccacatatc attatgaagt agaaataatc ttgtatgttt ttgtcagcat 4980
ctggagaaag gtttctatat tgaacccaca atcattactg atgtcgatac atcaatgcaa 5040
atttggaggg aagaagtttt tggtccagtg ctctgtgtga aagaatttag cactgaagaa 5100
gaagccattg aattggccaa cgatactcag tgagtttttt ttttaataca gttcattgtc 5160
ctgttcaatc ttgcagcata tgtatatact ctgtggcata tgaacttatt ctgctactac 5220
tacttttgat agttatggtc tggctggtgc tgtgctttcc ggtgaccgcg agcgatgcca 5280
gagattaact gaggtatatc caagtgaagg gggttggcat tgtttgattc atatgacatg 5340
gttgcatcaa gctgatattc aagaatctca tttattactt gcattctatg catctccagt 5400
tcttccctgg actccggtca atgttaatat agtttgtttg ctagtagtat gctactccaa 5460
ttaagttgct cttcacttcc acatcatctg atccatgact ttatatttga cccctttttt 5520
ttgcaaaaga aagggaaata cttaacgaaa atttcctact gcaggagatc gatgccggaa 5580
ttatctgggt gaactgctcg caaccctgct tctgccaagc tccatggggc gggaacaagc 5640
gcagcggctt tggacgcgag ctcggagaag ggtgggtagc acacaacaat ctcactttaa 5700
aacaccattt cgatcgtctg atgatctcga cctgacatca tgcctttggt attttcattc 5760
acttttcagg ggcattgaca actacctaag cgtcaagcaa gtgacggagt acgcctccga 5820
tgagccgtgg ggatggtaca aatccccttc caagctgtaa 5860
<210> 18
<211> 2192
<212> DNA
<213> 水稻OsSWEET14基因组DNA序列(DNA序列)
<400> 18
atggctggca tgtctcttca gcatccctgg gccttcgcct ttggtctcct aggtgtgttg 60
cctttgatct gatccaagga attctcttga gaattaatct tgcatggtta tttacttttg 120
ttgttattat tctctacatt tttaatcatg tacttttcca tgttccactt ttgttgccaa 180
agctactata tttttcctac caattcatcc aaaactacta tattatagca aggcagctag 240
tggatcgact ttgcactttt ggatgcaatt gtgagtggtt tacattagag gggccatgca 300
tagccaaata aattgtttgg caaaatatga tttcccttgt agttagcaca atattgtgat 360
ctttcattcc tttactcttt ttgttccacc accctcatta ttgcaaagcc ccctctttta 420
gaaccaaact aaagataaga aacatttgat tcatcattag aggagattag atatacatac 480
atactacaca tgcattgctg tgataagcct agccaggcac agaaagagcc aagacaaaag 540
gagctcaaaa gaaaaggggc tccaatatct tgcccggcct gatcagtgta acatgacgtc 600
acccacacaa ttattaaaag gatagatgca tatgtgttcg ttacgtatct ccttgtgtca 660
cgttgctgtg catggttcac tcgcttaatt ataacgtccg tcgcatttta tgcatgcact 720
tcgtttttag ttaatcaaat taaacaagat cctaacatat gatttctatt ttattctctt 780
tgcaggcaac atcatctcct tcatgaccta cctggcccca ctgtaagtcc cacacatccg 840
gatattttct tttctttagc gaaattttac attgctccag aaagtacctt ttacactaaa 900
atttcttata caccaccata aaattaatgt ggtactattg gtaccttatc aaaaatgata 960
aaattacctt tttcttcaga taaaaacact ccccgtctct gtataactaa gatgtagaca 1020
accaatacac atgtctagag ctaatcctat caattaacat tgctagtaaa tacaaggaaa 1080
aatataaaga attaaccaat tgcttggatg tcttgcaggc cgacgttcta caggatctac 1140
aagagcaagt cgacgcaggg gttccagtcg gtaccctacg tggtggcgct gttcagcgcg 1200
atgctgtgga tctactacgc gctgctcaag tccgacgagt gcctcctcat caccatcaac 1260
tccgctggct gcgtcatcga gaccatctac atcgccgtct acctcgtcta cgcccccaag 1320
aaggccaaga tgttcaccgc caagctcctc ctcctcgtca acgtcggcgt cttcggcctc 1380
atcctcctcc tcaccctcct cctctccgcc ggcgaccgcc gcatcgtggt tcttggttgg 1440
gtctgcgttg gcttctccgt cagcgtcttc gtcgcccccc ttagcatcat cgtaagaaac 1500
cctagaattg cctgtaaaca ataataactt tcggtctctg caccaactaa ggatgcacat 1560
atttacgcac cgcttttgct atctctgcag aggctggtgg tgcgcaccaa gagcgtggag 1620
ttcatgccgt tctcgctctc cttctccctc accatcagcg ccgtcgtctg gttcctctac 1680
ggcctcctca tcaaggacaa atatgtcgct gtgagtagct ccgattcgac ccgttcttct 1740
tcctaaattt tccgctgctc gatttaattt ctatttctaa ttgtggaaga ttgtttaatt 1800
atagtgatta tggctagctg ataaccgatt ttaatttctg atggtgatcc aaaatggaac 1860
agcttcccaa cgtgctgggc ttctccttcg gcgtcatcca gatggggctg tacgccatgt 1920
acaggaactc gacgcccaag gccgtgctga ccaaggaggt cgaggcggcg acggccaccg 1980
gcgacgacga ccactccgcc gccggcgtca aggagcacgt cgtcaacatc gccaagctct 2040
ctgccgccgt cgacgtcgtc aagacccgcg aggtgcaccc cgtcgacgtc gagtccccgc 2100
cggcagaggc gccgcctgag gaggacgaca aggccgccgc cgccaccgcc gccgccgtcg 2160
ccggcgccgg cgagaagaag gtagctgcat ga 2192
<210> 19
<211> 657
<212> PRT
<213> 马铃薯StALS2蛋白氨基酸序列(氨基酸序列)
<400> 19
Met Ala Ala Ala Ser Pro Ser Pro Cys Phe Ser Lys Asn Leu Pro Pro
1 5 10 15
Ser Ser Ser Lys Ser Ser Ile Leu Leu Pro Lys Ser Thr Phe Thr Phe
20 25 30
His Asn His Pro Lys Asn Thr Ser Pro Leu His Leu Thr His Thr Gln
35 40 45
His His Ser Arg Phe Thr Val Ser Asn Val Ile Leu Ser Thr Thr Thr
50 55 60
His Asn Asp Val Ser Glu Pro Glu Ile Phe Val Ser Arg Phe Ala Pro
65 70 75 80
Asp Glu Pro Arg Lys Gly Cys Asp Val Leu Val Glu Ala Leu Glu Arg
85 90 95
Glu Gly Val Lys Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu
100 105 110
Ile His Gln Ala Leu Thr Arg Ser Asn Ile Ile Arg Asn Val Leu Pro
115 120 125
Arg His Glu Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ala
130 135 140
Thr Gly Phe Pro Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr
145 150 155 160
Asn Leu Val Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Ile Pro Ile
165 170 175
Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala
180 185 190
Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His
195 200 205
Asn Tyr Leu Val Met Asp Val Glu Asp Ile Pro Arg Val Val Arg Glu
210 215 220
Ala Phe Phe Leu Ala Lys Ser Gly Arg Pro Gly Pro Val Leu Ile Asp
225 230 235 240
Val Pro Lys Asp Ile Gln Gln Gln Leu Val Ile Pro Asn Trp Asp Gln
245 250 255
Pro Met Arg Leu Pro Gly Tyr Ile Ser Arg Leu Pro Lys Leu Pro Asn
260 265 270
Glu Met Leu Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys
275 280 285
Pro Val Leu Tyr Val Gly Gly Gly Cys Thr Gln Ser Ser Glu Glu Leu
290 295 300
Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met
305 310 315 320
Gly Leu Gly Thr Phe Pro Cys Gly Asp Glu Leu Ser Leu Gln Met Leu
325 330 335
Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Ser Ser Asp
340 345 350
Leu Leu Leu Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys
355 360 365
Leu Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp
370 375 380
Ser Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile Cys Ala
385 390 395 400
Asp Ile Lys Leu Ala Leu Gln Gly Leu Asn Ser Ile Leu Glu Gly Lys
405 410 415
Glu Gly Lys Leu Lys Leu Asp Phe Ser Ala Trp Arg Gln Glu Leu Thr
420 425 430
Glu Gln Lys Val Lys Tyr Pro Leu Asn Tyr Lys Thr Phe Gly Glu Ala
435 440 445
Ile Pro Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr Asn Gly
450 455 460
Asn Ala Ile Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala
465 470 475 480
Gln Tyr Tyr Lys Tyr Lys Lys Pro Arg Gln Trp Leu Thr Ser Gly Gly
485 490 495
Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ala Val
500 505 510
Gly Arg Pro Gly Glu Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe
515 520 525
Ile Met Asn Val Gln Glu Leu Ala Thr Ile Lys Val Glu Asn Leu Pro
530 535 540
Val Lys Ile Met Leu Leu Asn Asn Gln His Leu Gly Met Val Val Gln
545 550 555 560
Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr Leu Gly
565 570 575
Asn Pro Ala Asn Glu Glu Glu Ile Phe Pro Asn Met Leu Lys Phe Ala
580 585 590
Glu Ala Cys Gly Val Pro Ala Ala Arg Val Ser His Arg Asp Asp Leu
595 600 605
Arg Ala Ala Ile Gln Lys Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu
610 615 620
Asp Val Ile Val Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser
625 630 635 640
Gly Gly Ala Phe Lys Asp Val Ile Thr Glu Gly Asp Gly Arg Arg Ser
645 650 655
Tyr
<210> 20
<211> 1974
<212> DNA
<213> 马铃薯StALS2基因DNA序列(DNA序列)
<400> 20
atggcggctg catctccatc tccttgtttt tccaaaaacc tacctccatc ttcatcaaaa 60
tcttccatcc ttcttcccaa atctaccttt actttccaca atcaccccaa aaatacctca 120
ccccttcacc ttacccacac ccaacatcat agccgtttca ctgtctcaaa tgtcatccta 180
tcaaccacga cccataacga cgtttctgaa cccgaaatct tcgtttcacg tttcgcccct 240
gacgaaccca gaaagggttg tgatgttctt gtggaggcac ttgaaaggga aggggttaag 300
gatgtatttg catacccagg aggtgcttcc atggagattc atcaggcttt gacacgttcc 360
aatattattc gtaatgtgct gccacgtcat gaacagggtg gtgtgtttgc tgcagagggt 420
tacgcacggg ccactgggtt ccctggtgtt tgcattgcta catctggtcc gggagctacg 480
aatcttgtta gcggtcttgc ggatgctttg ttggatagta ttccgattgt tgctattacg 540
ggtcaagtgc cgaggaggat gattggtact gatgcgtttc aggaaactcc tattgttgag 600
gtaacgagat ccattacgaa gcataattat cttgttatgg atgtagagga tattcctagg 660
gttgttcgtg aagcgttttt tctagcgaaa tcgggacggc ctggaccggt tctgattgat 720
gttcctaagg atattcagca acaattggtg atacctaatt gggatcagcc aatgaggttg 780
cctggttaca tctctaggtt gcctaaattg cctaatgaga tgcttttgga acaaattgtt 840
aggctgattt cggagtcgaa gaagcctgtt ttgtatgtgg gtggtgggtg tacacaatcg 900
agtgaggagc tgagacgatt tgtggagctt acgggtattc ctgtggcgag tactttgatg 960
ggtcttggaa cttttccatg tggggatgag ctttctcttc aaatgttggg tatgcatggg 1020
actgtgtatg ctaattatgc ggtggatagt agtgatttgt tgcttgcatt tggggtgagg 1080
tttgatgatc gagttactgg taaattggaa gcttttgcta gccgagcgaa aattgtccac 1140
attgatattg attcggctga gattggaaag aacaagcaac ctcatgtttc catttgtgca 1200
gatatcaagt tggcattaca gggtttgaat tccatattgg agggtaaaga aggtaagctg 1260
aagttggact tttctgcttg gaggcaggag ttaacggagc agaaggtgaa gtacccattg 1320
aattataaga cttttggtga agccatccct ccacaatatg ctattcaggt tcttgatgag 1380
ttaactaacg gaaatgccat tattagtact ggtgtggggc aacaccaaat gtgggctgcc 1440
caatactata agtacaaaaa gccacgccaa tggttgacat ctggtggatt aggagcaatg 1500
ggatttggtt tgcctgctgc tataggtgcg gctgttggaa gaccgggtga gattgtggtt 1560
gacattgatg gtgacgggag ttttatcatg aatgtgcagg agttagcaac aattaaggtg 1620
gagaatctcc cagttaagat tatgttactg aataatcaac acttgggaat ggtggttcag 1680
tgggaggatc gattctataa ggctaacaga gcacacactt acttgggtaa tcctgctaat 1740
gaggaagaaa tcttccctaa tatgctgaaa tttgcagagg cttgtggcgt acctgctgca 1800
agagtgtcac acagggatga tcttagagct gccattcaaa agatgttaga cactcctggg 1860
ccatacttgt tggatgtgat tgtacctcat caggagcacg ttctacctat gattcccagt 1920
ggtggcgctt tcaaagatgt gattacggag ggtgatggga gacgttccta ttga 1974
<210> 21
<211> 1424
<212> DNA
<213> HBB基因DNA序列(包括内含子DNA序列)
<400> 21
atggtgcacc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60
gtggatgaag ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt 120
aaggagacca atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg 180
cactgactct ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc 240
ttggacccag aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg 300
caaccctaag gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc 360
tcacctggac aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct 420
gcacgtggat cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc 480
ttcttttcta tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag 540
aatgggaaac agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt 600
ttatttgctg ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct 660
tctccgcaat ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata 720
tctctgagat acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac 780
tatttggaat atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt 840
atttttaatt gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata 900
tgtgtacaca tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt 960
cttcttttaa tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt 1020
tcagggcaat aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg 1080
ataatttctg ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat 1140
tgtaactgat gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg 1200
cttttatttt atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc 1260
taatcatgtt catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg 1320
tgctggccca tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag 1380
tggtggctgg tgtggctaat gccctggccc acaagtatca ctaa 1424
<210> 22
<211> 444
<212> DNA
<213> HBB基因CDS序列(DNA序列)
<400> 22
atggtgcacc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60
gtggatgaag ttggtggtga ggccctgggc aggctgctgg tggtctaccc ttggacccag 120
aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 180
gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 240
aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 300
cctgagaact tcaggctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 360
aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat 420
gccctggccc acaagtatca ctaa 444
<210> 23
<211> 147
<212> PRT
<213> HBB基因氨基酸序列(氨基酸序列)
<400> 23
Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp
1 5 10 15
Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu
20 25 30
Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp
35 40 45
Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His
50 55 60
Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp
65 70 75 80
Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys
85 90 95
Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val
100 105 110
Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln
115 120 125
Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His
130 135 140
Lys Tyr His
145

Claims (49)

1.一种在生物体内产生新突变的方法,其包括以下步骤:在生物体基因组的特定位置上按先后顺序依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;其中,
所述的“DNA断裂”是通过将具有靶向特性的核酸酶递送到生物体细胞内与基因组DNA特定位置接触实现的;
所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割;
所述“两个以上的DNA断裂”是将不同靶向的靶向核酸酶递送到同一个受体细胞中产生的,即由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生,或由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生;
所述“靶向核酸酶”为所有能实现基因组编辑的CRISPR/Cas核酸酶。
2.根据权利要求1所述的方法,其特征在于,所述靶向核酸酶以DNA形式存在。
3.根据权利要求1所述的方法,其特征在于,所述靶向核酸酶以mRNA或蛋白形式存在,而非DNA形式。
4.根据权利要求1-3任意一项所述的方法,其特征在于,将靶向核酸酶递送到细胞内的方法选自1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;5)基因枪轰击;或6)农杆菌介导的转化方法。
5.一种不依赖外源转基因标记筛选编辑事件的方法,包括以下步骤:
1) 在受体细胞第一目标基因的特定位置上按先后顺序依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2) 第一目标基因特定位置经顺次切割并修复后产生的某些编辑事件,能够赋予突变体细胞对某种筛选压力的抗性,产生表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的生物;
其中,所述的“DNA断裂”是通过将具有靶向特性的核酸酶递送到生物体细胞内与基因组DNA特定位置接触实现的;
所述的“具有靶向特性的核酸酶”为所有能实现基因组编辑的CRISPR/Cas核酸酶;
所述的“特定位置上按先后顺序依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割;
所述“两个以上的DNA断裂”是由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生,或由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
6.根据权利要求5所述的方法,其特征在于,还包括步骤3)在第一目标基因之外,同时使用针对至少一个第二目标基因的靶向核酸酶对其它靶点进行编辑,通过筛选第一目标基因突变产生的可选择性状同步对第二目标基因的编辑事件进行富集筛选,分离出同时含有第一目标基因与至少一个第二目标基因编辑事件的细胞、组织、器官或完整的生物。
7.根据权利要求5或6所述的方法,其特征在于,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
8.根据权利要求5或6所述的方法,其特征在于,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
9.根据权利要求8所述的方法,其特征在于,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失。
10.根据权利要求5或6所述的方法,其特征在于,所述“某种筛选压力”是环境压力或添加的化合物压力。
11.根据权利要求10所述的方法,其特征在于,所述环境压力为高温、低温或低氧;所述添加的化合物压力为盐离子浓度、抗生素、细胞毒素或除草剂。
12.根据权利要求6所述的方法,其特征在于,所述“第二目标基因”是指编码与第一目标基因不同的其它基因。
13.根据权利要求6所述的方法,其特征在于,所述“针对至少一个第二目标基因的靶向核酸酶”与在第一目标基因特定位置上产生DNA断裂使用的CRISPR/Cas核酸酶相同或不同。
14.根据权利要求6所述的方法,其特征在于,所述靶向核酸酶以DNA形式存在。
15.根据权利要求6所述的方法,其特征在于,所述靶向核酸酶以mRNA或蛋白形式存在,而非DNA形式。
16.根据权利要求6所述的方法,其特征在于,将靶向核酸酶递送到细胞内的方法选自1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;5)基因枪轰击;或6)农杆菌介导的转化方法。
17.一种对生物体基因组进行非转基因瞬时编辑的方法,包括以下步骤:
1)针对受体细胞第一目标基因的特定位置设计并合成至少两条crRNA片段组合或至少两条sgRNA片段组合,所述crRNA组合与tracrRNA结合或单独使用sgRNA组合能够引导对应的Cas蛋白在受体细胞第一目标基因的特定位置上依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2)将适量CRISPR/Cas蛋白或其相应的mRNA与上述预先设计合成的能够引导第一目标基因定点编辑产生内源筛选标记的crRNA片段组合和tracrRNA片段或单独sgRNA片段组合混合;
3)将上述RNP复合体递送到受体细胞中,与基因组DNA特定位置接触实现基因编辑;
4)根据RNP复合体对第一目标基因的定点编辑产生的表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的生物;
其中,所述的CRISPR/Cas蛋白为所有能实现基因组编辑的CRISPR/Cas核酸酶;
所述的“特定位置上依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割;
所述“两个以上的DNA断裂”是由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生,或由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
18.根据权利要求17所述的方法,其特征在于,所述步骤2)进一步加入至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段,在体外孵育形成RNP复合体。
19.根据权利要求18所述的方法,其特征在于,所述步骤4)进一步分离出同时含有第一目标基因与至少一个第二、第三或更多目标基因的编辑事件的细胞、组织、器官或完整的生物。
20.根据权利要求17-19任意一项所述的方法,其特征在于,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
21.根据权利要求17-19任意一项所述的方法,其特征在于,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
22.根据权利要求21所述的方法,其特征在于,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失。
23.根据权利要求21所述的方法,其特征在于,所述“某种筛选压力”是环境压力或添加的化合物压力。
24.根据权利要求23所述的方法,其特征在于,所述环境压力为高温、低温或低氧;所述添加的化合物压力为盐离子浓度、抗生素、细胞毒素或除草剂。
25.根据权利要求18或19所述的方法,其特征在于,所述“第二、第三或更多目标基因”是指编码与第一目标基因不同的其它基因。
26.根据权利要求18或19所述的方法,其特征在于,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA共用同一种Cas蛋白。
27.根据权利要求18或19所述的方法,其特征在于,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA使用识别不同PAM序列的Cas蛋白。
28.根据权利要求17-19任意一项所述的方法,其特征在于,将所述RNP复合体递送到细胞内的方法选自1)PEG介导的细胞转染的方法;2)脂质体介导的细胞转染的方法;3)电击转化的方法;4)显微注射;或5)基因枪轰击。
29.一种对植物基因组进行非转基因瞬时编辑的方法,包括以下步骤:
1)针对受体植物细胞或组织第一目标基因的特定位置设计并合成至少两条crRNA片段组合或至少两条sgRNA片段组合,所述crRNA组合与tracrRNA结合或单独使用sgRNA组合能够引导对应的Cas蛋白在受体细胞第一目标基因的特定位置上依次产生两个以上的DNA断裂并分别自发修复,其中在后的DNA断裂以在先的DNA断裂修复后产生的新序列为基础产生;
2)将适量CRISPR/Cas蛋白或其相应的mRNA与上述预先设计合成的能够引导第一目标基因定点编辑产生内源筛选标记的crRNA片段组合和tracrRNA片段或单独sgRNA片段组合混合;
3)将上述RNP复合体递送到受体植物细胞或组织中,与基因组DNA特定位置接触实现基因编辑;
4)根据RNP复合体对第一目标基因的定点编辑产生的表型可选择的性状,施加相对应的筛选压力对该性状进行选择,分离出含有该类编辑事件的细胞、组织、器官或完整的植物;
其中,所述的CRISPR/Cas蛋白为所有能实现基因组编辑的CRISPR/Cas核酸酶;
所述的“特定位置上依次产生两个以上的DNA断裂”是指针对由CRISPR/Cas系统编辑产生的在先的DNA断裂修复事件形成的新序列设计新的靶向RNA,对该位点再次进行切割;
所述“两个以上的DNA断裂”是由同一种CRISPR/Cas核酸酶与不同的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生,或由两种以上识别不同PAM序列的CRISPR/Cas核酸酶与对应的gRNA或sgRNA分别组成RNP复合体按先后顺序切割对应的靶点序列产生。
30.根据权利要求29所述的方法,其特征在于,所述步骤2)进一步加入至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段,在体外孵育形成RNP复合体。
31.根据权利要求30所述的方法,其特征在于,所述步骤4)进一步分离出同时含有第一目标基因与至少一个第二、第三或更多目标基因的编辑事件的细胞、组织、器官或完整的植物。
32.根据权利要求29-31任意一项所述的方法,其特征在于,所述“第一目标基因”是编码至少一种表型可选择性状的基因位点,其中所述至少一种表型可选择性状是抗性/耐受性性状或生长优势性状。
33.根据权利要求29-31任意一项所述的方法,其特征在于,所述“第一目标基因的特定位置”是指所述位置处经顺次切割并修复后产生的某些突变类型能够赋予所述受体细胞对某种筛选压力的抗性,产生至少一种表型可选择的抗性/耐受性性状或生长优势性状。
34.根据权利要求33所述的方法,其特征在于,所述“某些突变类型”包括单碱基替换、多个碱基的替换或不特定数目的碱基插入或缺失。
35.根据权利要求33所述的方法,其特征在于,所述“某种筛选压力”是环境压力或添加的化合物压力。
36.根据权利要求35所述的方法,其特征在于,所述环境压力为高温、低温或低氧;所述添加的化合物压力为盐离子浓度、抗生素、细胞毒素或除草剂。
37.根据权利要求29-31任意一项所述的方法,其特征在于,所述“受体植物细胞或组织”为任何能作为瞬时表达受体并能经过组织培养再生为完整植株的细胞或组织。
38.根据权利要求37所述的方法,其特征在于,所述细胞为原生质体细胞或悬浮细胞;所述组织为愈伤组织、幼胚、成熟胚、叶片、茎尖、幼穗或下胚轴。
39.根据权利要求30或31所述的方法,其特征在于,所述“第二、第三或更多目标基因”是指编码与第一目标基因不同的其它基因。
40.根据权利要求30或31所述的方法,其特征在于,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA共用同一种Cas蛋白。
41.根据权利要求30或31所述的方法,其特征在于,所述“至少一个靶向第二、第三或更多目标基因的人工合成的crRNA和tracrRNA片段或人工合成的sgRNA片段”与靶向第一目标基因的crRNA或sgRNA使用识别不同PAM序列的Cas蛋白。
42.根据权利要求29-31任意一项所述的方法,其特征在于,将所述RNP复合体递送到植物细胞内的方法选自1)PEG介导的原生质体转化的方法;2)显微注射;3)基因枪轰击;4)碳化硅纤维介导法;或5)真空渗入法或其他任何瞬时导入方法。
43.根据权利要求29-31任意一项所述的方法,其特征在于,所述“第一目标基因”是编码选自除草剂抗性/耐受性的至少一种表型可选择性状的至少一个内源基因,其中除草剂抗性/耐受性选自包括对EPSPS抑制剂的抗性/耐受性、对谷氨酰胺合成抑制剂的抗性/耐受性、对ALS或AHAS抑制剂的抗性/耐受性、对ACCase抑制剂的抗性/耐受性、对类胡萝卜素生物合成抑制剂的抗性/耐受性、对纤维素抑制剂的抗性/耐受性、对脂质合成抑制剂的抗性/耐受性、对长链脂肪酸抑制剂的抗性/耐受性、对微管组装抑制剂的抗性/耐受性、对光系统I电子分流剂的抗性/耐受性、对光系统II抑制剂的抗性/耐受性或对PPO抑制剂的抗性/耐受性和对合成生长素的抗性/耐受性。
44.根据权利要求43所述的方法,其特征在于,所述“第一目标基因”选自PsbA、ALS、EPSPS、ACCase、PPO、HPPD、PDS、GS、DOXPS、TIR1或AFB5。
45.根据权利要求44所述的方法,其特征在于,所述“第一目标基因”为ALS,所述“基因的特定位置”是指拟南芥AtALS蛋白氨基酸序列位点A122、P197、R198、D204、A205、D376、R377、W574、S653或G654,以及以AtALS氨基酸序列为参照标准的其它植物的ALS蛋白相对应的上述氨基酸位点;或
所述crRNA或sgRNA靶向包含选自编码AtALS蛋白氨基酸序列位点A122、P197、R198、D204、A205、D376、R377、W574、S653、G654或其任意组合的序列的靶序列,以及以AtALS氨基酸序列为参照标准的其它植物的ALS蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。
46.根据权利要求44所述的方法,其特征在于,所述“第一目标基因”为ACCase,所述“基因的特定位置”是指大穗看麦娘AmACCase蛋白氨基酸序列位点I1781、E1874、N1878、W1999、W2027、I2041、D2078、C2088或G2096,以及以AmACCase氨基酸序列为参照标准的其它单子叶植物的ACCase蛋白相对应的上述氨基酸位点;或
所述crRNA或sgRNA靶向包含选自编码AmACCase基因氨基酸序列位点I1781、E1874、N1878、W1999、W2027、I2041、D2078、C2088、G2096或其任意组合的序列的靶序列,以及以AmACCase氨基酸序列为参照标准的其它单子叶植物的ACCase蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。
47.根据权利要求44所述的方法,其特征在于,所述“第一目标基因”为HPPD,所述“基因的特定位置”是指水稻OsHPPD蛋白氨基酸序列位点H141、L276、P277、N338、G342、R346、D370、P386、K418或G419,以及以OsHPPD氨基酸序列为参照标准的其它植物的HPPD蛋白相对应的上述氨基酸位点;或
所述crRNA或sgRNA靶向包含选自编码OsHPPD基因氨基酸序列位点H141、L276、P277、N338、G342、R346、D370、P386、K418、G419或其任意组合的序列的靶序列,以及以OsHPPD氨基酸序列为参照标准的其它植物的HPPD蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。
48.根据权利要求44所述的方法,其特征在于,所述“第一目标基因”为PPO,所述“基因的特定位置”是指水稻OsPPO1蛋白氨基酸序列位点S128、V217、S223、V364、K373、L423、Y425或W470,以及以OsPPO1氨基酸序列为参照标准的其它植物的PPO蛋白相对应的上述氨基酸位点;或
所述crRNA或sgRNA靶向包含选自编码OsPPO1基因氨基酸序列位点S128、V217、S223、V364、K373、L423、Y425、W470或其任意组合的序列的靶序列,以及以OsPPO1氨基酸序列为参照标准的其它植物的PPO蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。
49.根据权利要求44所述的方法,其特征在于,所述“第一目标基因”为TIR1,所述“基因的特定位置”是指水稻OsTIR1蛋白氨基酸序列位点F93、F357、C413或S448,以及以OsTIR1氨基酸序列为参照标准的其它植物的TIR1蛋白相对应的上述氨基酸位点;或
所述crRNA或sgRNA靶向包含选自编码OsTIR1基因氨基酸序列位点F93、F357、C413、S448或其任意组合的序列的靶序列,以及以OsTIR1氨基酸序列为参照标准的其它植物的TIR1蛋白相对应的上述氨基酸位点及其任意组合的序列的靶序列。
CN202011089074.9A 2019-11-07 2020-10-13 一种在生物体内产生新突变的方法及应用 Active CN112251419B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
CN201911081617X 2019-11-07
CN201911081617 2019-11-07
CN2020108218772 2020-08-15
CN202010821877 2020-08-15
CN2020109741512 2020-09-16
CN202010974151 2020-09-16

Publications (2)

Publication Number Publication Date
CN112251419A CN112251419A (zh) 2021-01-22
CN112251419B true CN112251419B (zh) 2023-11-10

Family

ID=74243079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011089074.9A Active CN112251419B (zh) 2019-11-07 2020-10-13 一种在生物体内产生新突变的方法及应用

Country Status (13)

Country Link
US (1) US20230287389A1 (zh)
EP (1) EP3889266A4 (zh)
JP (1) JP2023500357A (zh)
KR (1) KR20220093324A (zh)
CN (1) CN112251419B (zh)
AU (1) AU2020378387A1 (zh)
BR (1) BR112022008916A2 (zh)
CA (1) CA3159682A1 (zh)
CL (1) CL2021003593A1 (zh)
IL (1) IL289541A (zh)
MX (1) MX2022001245A (zh)
WO (1) WO2021088601A1 (zh)
ZA (1) ZA202203920B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115161316A (zh) * 2021-04-02 2022-10-11 上海科技大学 一种引导编辑工具、融合rna及其用途
CN113846075A (zh) * 2021-11-29 2021-12-28 科稷达隆(北京)生物技术有限公司 Mad7-nls融合蛋白、用于植物基因组定点编辑的核酸构建物及其应用
CN114145231B (zh) * 2021-12-16 2022-09-13 广西壮族自治区中国科学院广西植物研究所 一种二色波罗蜜种苗快速繁殖方法
CN117987447A (zh) * 2022-11-02 2024-05-07 广州大学 一种真核细胞持续进化的控制方法及其应用
CN115644067B (zh) * 2022-12-09 2023-03-14 云南省农业科学院药用植物研究所 一种生产滇黄精双单倍体的方法
CN116286869B (zh) * 2023-03-23 2024-04-05 石河子大学 一种羽毛针禾糖转运蛋白基因SpSWEET14在提高植物抗寒性中的应用
CN117918260B (zh) * 2024-03-21 2024-05-24 西南林业大学 一种云南松组培苗的繁殖方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018140899A1 (en) * 2017-01-28 2018-08-02 Inari Agriculture, Inc. Novel plant cells, plants, and seeds
WO2018202199A1 (en) * 2017-05-05 2018-11-08 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Methods for isolating cells without the use of transgenic marker sequences
CN109536527A (zh) * 2018-11-27 2019-03-29 中国科学院动物研究所 一种基因点突变修复的新方法
CA3091157A1 (en) * 2017-12-21 2019-06-27 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for base editing in plants
CN110373430A (zh) * 2018-04-13 2019-10-25 青岛清原化合物有限公司 一种随机突变的基因编辑系统及其应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100287641A1 (en) * 2007-04-04 2010-11-11 Basf Plant Science Gmbh Ahas mutants
US20120005773A1 (en) * 2008-10-01 2012-01-05 Aasen Eric D Transgenic plants with enhanced agronomic traits
EP3036331B1 (en) * 2013-08-21 2021-06-16 BASF Agricultural Solutions Seed US LLC Als inhibitor herbicide tolerant mutant plants
US20160298129A1 (en) * 2013-12-02 2016-10-13 Bayer Cropscience Nv Als inhibitor herbicide tolerant mutant plants
KR20180081618A (ko) * 2015-11-30 2018-07-16 듀크 유니버시티 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법
US20170314033A1 (en) * 2016-05-02 2017-11-02 Ohio State Innovation Foundation Herbicide-resistant taraxacum kok-saghyz and taraxacum brevicorniculatum
US20210230616A1 (en) * 2017-05-05 2021-07-29 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Methods for isolating cells without the use of transgenic marker sequences
AR111790A1 (es) * 2017-05-11 2019-08-21 Inst Genetics & Developmental Biology Cas Método para la producción de una planta resistente a herbicidas mediante la introducción de un sistema de edición de bases de un gen relacionado con la resistencia a herbicidas
WO2019157326A1 (en) * 2018-02-08 2019-08-15 Zymergen Inc. Genome editing using crispr in corynebacterium
US20190330643A1 (en) * 2018-04-25 2019-10-31 The Catholic University Of America Engineering of bacteriophages by genome editing using the crispr-cas9 system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018140899A1 (en) * 2017-01-28 2018-08-02 Inari Agriculture, Inc. Novel plant cells, plants, and seeds
WO2018202199A1 (en) * 2017-05-05 2018-11-08 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Methods for isolating cells without the use of transgenic marker sequences
CA3091157A1 (en) * 2017-12-21 2019-06-27 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for base editing in plants
CN110373430A (zh) * 2018-04-13 2019-10-25 青岛清原化合物有限公司 一种随机突变的基因编辑系统及其应用
CN109536527A (zh) * 2018-11-27 2019-03-29 中国科学院动物研究所 一种基因点突变修复的新方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CRISPR-Cas9 Structures and Mechanisms;Fuguo Jiang等;《Annual Review of Biophysics》;20170531;第46卷;全文 *
广西科学技术协会.《大开眼界》.广西科学技术出版社,2018,全文. *

Also Published As

Publication number Publication date
IL289541A (en) 2022-03-01
ZA202203920B (en) 2023-11-29
CN112251419A (zh) 2021-01-22
AU2020378387A1 (en) 2022-01-20
CA3159682A1 (en) 2021-05-14
US20230287389A1 (en) 2023-09-14
MX2022001245A (es) 2022-02-22
CL2021003593A1 (es) 2022-08-19
WO2021088601A1 (zh) 2021-05-14
EP3889266A4 (en) 2022-08-10
KR20220093324A (ko) 2022-07-05
JP2023500357A (ja) 2023-01-05
EP3889266A1 (en) 2021-10-06
BR112022008916A2 (pt) 2022-08-02
TW202130813A (zh) 2021-08-16

Similar Documents

Publication Publication Date Title
CN112251419B (zh) 一种在生物体内产生新突变的方法及应用
EP4074832A1 (en) Method for creating new gene in organism and use thereof
CN113403289B (zh) 突变型对羟苯基丙酮酸双氧化酶、其编码核酸以及应用
CN115354039A (zh) 在生物体内创制新基因的方法及应用
WO2019233349A1 (zh) 突变型对羟苯基丙酮酸双氧化酶、其编码核酸以及应用
AU2016295291A1 (en) Wheat plants resistant to powdery mildew
CN111511199A (zh) 改良蓝色糊粉及其他分离系统
CN113249343A (zh) 具有抗除草剂特性的多肽、核酸及其应用
CN113249344A (zh) 抗除草剂突变蛋白、核酸及其应用
CN113874388A (zh) 孤雌生殖基因
CN113249346A (zh) 抗除草剂多肽、核酸及其应用
CN113249345A (zh) 抗除草剂多肽、核酸及其应用
TWI840629B (zh) 一種產生突變的基因的方法
CN106459884A (zh) 土壤杆菌及使用土壤杆菌的转化植物的制造方法
US10190133B2 (en) Compositions and methods for improving abiotic stress tolerance
CN113528554B (zh) 梨类纤维素合成酶基因PbrCSLD5及其应用
OA21191A (en) Method for creating new gene in organism and use thereof.
RU2781830C2 (ru) Мутантная п-гидроксифенилпируватдиоксигеназа, нуклеиновая кислота, кодирующая ее, и их применение
WO2024023764A1 (en) Increasing gene expression for increased protein content in plants
CN113493784A (zh) 一种突变多核苷酸及其应用
WO2001059131A2 (de) Verwendung von palatinase- und trehalulase-sequenzen als nutritive marker in transformierten zellen
KR20120093118A (ko) 국화에서 분리된 신규 f3'h 유전자 및 이를 이용한 화색 돌연변이체 선별 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant