CN110268064A - 同源染色体之间的靶向重组及其用途 - Google Patents

同源染色体之间的靶向重组及其用途 Download PDF

Info

Publication number
CN110268064A
CN110268064A CN201880010638.XA CN201880010638A CN110268064A CN 110268064 A CN110268064 A CN 110268064A CN 201880010638 A CN201880010638 A CN 201880010638A CN 110268064 A CN110268064 A CN 110268064A
Authority
CN
China
Prior art keywords
plant
cell
dna
selection
target site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880010638.XA
Other languages
English (en)
Inventor
A·A·利维
C·梅拉梅德-巴萨多
S·菲勒-哈尤特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yeda Research and Development Co Ltd
Original Assignee
Yeda Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yeda Research and Development Co Ltd filed Critical Yeda Research and Development Co Ltd
Publication of CN110268064A publication Critical patent/CN110268064A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文描述了体细胞植物细胞基因组中同源染色体之间靶向重组的方法,其中靶位点可位于常染色质区域或异染色质区域内。这些方法利用同源染色体之间的靶向重组,可用于诱导体细胞植物细胞,导致靶向交叉或基因转换。所描述的方法利用在同源染色体上具有多态性等位基因的基因座处的预选内源靶位点。公开的靶位点基因座包括常染色质和异染色质中的那些基因座。

Description

同源染色体之间的靶向重组及其用途
技术领域
描述了靶向体细胞植物细胞中同源染色体之间DNA重组的方法,其中这些植物细胞可以是分离的细胞,分离的植物组织的一部分,整株植物的一部分或整株植物,其中靶序列可以对应常染色质或异染色质。
背景技术
DNA双链断裂(DNA double-strand breaks,DSB)是塑造植物基因组的强大力量之一。这些DSB可以在整个植物生命周期中,在体细胞或减数分裂细胞中于复制叉运动期间自发发生或在第一次减数分裂的早期阶段发育控制。它们还可以通过电离辐射、基因毒性药物或通过内切核酸酶的活化来诱导。未修复的DNA DSB可能导致极端类型的损伤,包括染色体丢失、导致配子不育或细胞死亡。DSB的修复也可能与插入/缺失(indels)突变有关。因此,DSB修复机制对于维持基因组完整性完全必需的。理解这些机制对于精确设计基因组的能力至关重要,例如用于定向诱变、基因打靶或用于其他类型的靶向染色体重组。
DNA DSB修复机制已在包括植物的许多生物中广泛研究。植物研究通过非同源末端连接(NHEJ)或同源重组(HR)表征了参与DSB修复的基因,并测试了体细胞和减数分裂组织中DSB修复的结果。NHEJ已经被广泛的物种和组织(主要是体细胞)所表征,使用多种DSB诱导剂,包括位点特异性大范围核酸酶、转座子切除和定制设计的核酸酶如锌指核酸酶(ZFN)、转录激活剂样效应物核酸酶(TALEN)和成簇的规律间隔短回文重复相关蛋白Cas9(CRISPR-Cas)。这些工作的新兴景象表明,NHEJ是植物体细胞中的重要修复途径。这种容易出错的机制涉及在DSB位点从数个碱基对(bp)到数千bp的indel,并且通常与微同源(microhomologies)相关。此外,基于CRISPR-Cas的系统被证明在包括番茄在内的广泛植物物种中具有高效率。
当考虑特定基因座处的体细胞重组时,体细胞植物细胞(somatic plant cell)中天然存在的同源重组非常低并且接近无效。这种低频率的同源重组被认为对维持大型和重复植物基因组的稳定性很重要。通过测试修复机制如染色体内重组和不等交换的转基因测定,在拟南芥中进行了几项解决通过HR在体细胞组织中修复DSB的机制的研究。在所有情况下,DSB诱导增强了HR修复率。来自不等交换测定的重组率远低于染色体内重组。使用等位基因序列对同源染色体进行体细胞DSB修复也在转基因烟草植物中进行了研究,使用转座因子诱导的断裂:切除转座子后发生HR修复;但没有检测到不动的元素。DSB诱导还可以使用异位基因组序列模板触发HR介导的修复,尽管频率非常低。
在切除活化剂(Ac)或Mutator元件后,在玉米中显示内源(非转基因)重组配偶体之间的HR的DSB诱导。在两种情况下,重组以顺式(cis)发生,在体细胞组织中位于转座子侧翼的重复之间。相反,生发Ac活性不会刺激玉米bronze基因座上同源染色体之间减数分裂重组的速率。这一结果可能是由于Ac切除与减数分裂重组之间缺乏协调,减数分裂HR对Spo11诱导的断裂的偏好,或其他未知原因。在特定基因组位置诱导同源染色体之间的HR的能力将为遗传学家和育种者提供用于靶向诱导交叉或基因转换的有力工具。
因此,需要能够在同源染色体之间提供靶向HR以便精确繁殖作物的方法。靶向HR的一种应用是靶向基因转换,即基因从一条染色体转移到其同源物。此类方法还应考虑通常可用于实现该目标的植物种群大小。同样,重复回交以获得同基因系的过程也可能将所需基因侧翼的大部分不需要的DNA拖入后代植物中。本文公开了同源染色体之间的靶向重组的方法,其可以用相对较小的植物群体进行并且不回收大的不需要的DNA片段。
植物染色体具有高度浓缩的异染色质,在着丝粒区中突出并且对应于减数分裂重组冷点和大部分去浓缩的常染色区域,通常对应于远端、亚端粒区域和减数分裂重组热点。虽然异染色质通常与转录不活动和抑制的遗传重组相关,但它仍含有转录活性基因。异染色质区域中同源染色体之间的靶向诱导重组在植物育种中是有利的,因为在没有这种重组的情况下,有害基因可能不会从有益基因中分离出来。本文公开了靶向体细胞植物细胞中同源染色体之间DNA重组的方法,其中显示靶向DSB诱导的重组发生在常染色和异染色靶位点。
DSB诱导的体细胞HR的另一个潜在应用是“靶向交叉”,即在精确位点处的大染色体区段的相互交换。目前的育种方法依赖于随机交叉和寻找罕见的重组事件,在连锁基因的情况下,可能需要数万株植物获得,其中天然存在的非靶向HR中的同源重组百分比在任何特定位点内。基因组接近0%(在每105-106天然HR事件中发生少于1)。
本文公开了可用于靶向体细胞HR中以结合来自亲本的所需性状并使用小植物群体在不期望的遗传连锁之间分离的方法。
发明内容
在一个方面,本文描述了靶向体细胞植物细胞中同源染色体之间DNA重组的方法,所述方法包括以下步骤:
(a)在所述植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选内源靶位点,其中在所述核酸酶系统表达时,所述多态性等位基因中的至少一个DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂;
(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或其所述植物的后代,用于同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);和
(c)选择其中发生靶向同源重组的植物细胞、其植物组织、其植物或其植物后代。
在一个方面,本文公开的方法产生包含有益性状或品质的组合的植物,该方法包括杂交体细胞植物细胞中同源染色体之间的靶向DNA重组,所述方法包括以下步骤:
(a)在所述植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选内源靶位点,其中在所述核酸酶系统表达时,所述多态性等位基因中的至少一个DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂;
(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或其所述植物的后代,用于所述同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);
(c)选择其中发生靶向同源重组的植物细胞、其植物组织、其植物或其植物后代;
(d)繁殖所述植物细胞或其植物组织或其植物或其植物后代以产生包含所述靶向同源重组的植物,其中所述植物包含杂交体细胞起源的任一亲本植物中不存在的有益品质或性状的组合。
在一个方面,本文公开了产生包含有益性状或品质的组合的后代植物的方法,其中所述组合不存在于任一亲本植物中,所述方法包括:
选择亲本植物,其中每个所述亲本包含至少一种有益性状,其中所述有益性状不相同,并且其中所述亲本对于至少一种所述有益性状是多态性的;
交叉所述亲本植物以建立杂交植物;
收集杂交植物的体细胞;
在所述体细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选内源靶位点,其中在表达所述核酸酶系统时,所述多态性等位基因的至少一个DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂,其中在所述靶向预选的内源靶位点处的同源交叉或基因转换(非交叉)导致表达或调节至少一种所述有益性状或品质的表达的DNA交换;
分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或其所述植物的后代,用于所述交叉或基因转换(非交换)事件,其中所述性状组合被表达;
选择其中表达性状组合的植物细胞、其植物组织、其植物或其植物后代;和
繁殖所述植物细胞、其植物组织、其植物,以产生包含所述有益性状或品质组合的后代植物。
在相关方面,核酸酶系统包含锌指核酸酶(ZFN)系统、转录激活因子样效应物核酸酶(TALEN)系统、或成簇的规律间隔短回文重复(CRISPR)/CRISPR相关蛋白(Cas)系统。
另一方面,核酸酶系统包含锌指核酸酶(ZFN),其包含锌指DNA结合结构域和DNA核酸酶切割结构域,其中所述锌指DNA结合结构域结合在所述预选的内源靶位点内,从而靶向DNA核酸酶切割结构域,以在所述预选的内源靶位点内切割DNA。另一方面,核酸酶系统包含转录激活因子样效应物核酸酶(TALEN)系统,其包含TAL效应物DNA结合结构域和DNA切割结构域,其中所述TAL效应物DNA结合结构域结合在所述预选的内源靶位点内,从而靶向DNA切割结构域,以在所述预选的内源靶位点内切割DNA。在另一方面,核酸酶系统包含CRISPR/Cas核酸酶系统,其包含CRISPR相关内切核酸酶和gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述CRISPR相关内切核酸酶切割所述预选的内源性靶位点内的DNA。另一方面,CRISPR相关内切核酸酶(Cas核酸酶)选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、C2c1、CasX、NgAgo、Csf1、Csf2、Csf3和Csf4,其同源物或其修饰形式。
在相关方面,体细胞植物细胞源自在所述预选位点具有多态性等位基因的现有杂合或杂合植物细胞。另一方面,现有的杂交或杂合植物细胞来源于野生型植物。
在相关方面,本文公开的方法产生体细胞植物细胞,其包含预选的内源靶位点内的靶向同源重组,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,来自包含所述体细胞植物细胞的植物或其后代植物的果实,或来自包含所述体细胞植物细胞的植物或其子代植物的种子,或其任何组合,具有亲本性状的组合,所述组合不存在于任一亲本。在另一个方面,亲本性状包括增加的抗旱性、增加的对害虫的抗性、对病原体的抗性增加、改善的营养物含量、或改善的生长参数、或对植物细胞、植物组织、植物、果实或种子任何其它有益的性状。
在相关方面,体细胞植物细胞源自来自两株植物杂交后代的细胞,其中所述亲本植物细胞各自包含与所述预选位点处的所述配偶(mate)相比的多态性等位基因。
在相关方面,本文公开的方法产生体细胞植物细胞,其包含预选内源靶位点内的靶向同源重组,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,或来自包含所述体细胞植物细胞的植物或其后代植物的果实,或衍生自包含所述体细胞植物细胞的植物或其子代植物或其任何组合的种子,所述植物具有所述亲本性状的组合,所述组合不存在于所述组合中亲本。另一方面,通过所述靶向同源重组而重组的亲本性状包括增加的抗旱性、增加的对害虫的抗性、对病原体的增加的抗性、改善的营养物含量、或改善的生长参数、或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状。
在一个相关方面,所述亲本体细胞植物细胞之一包含所述核酸酶系统,并且其中所述核酸酶系统的DNA裂解活性靶向存在于不包含所述核酸酶系统的另一亲本植物细胞中的多态性等位基因。
在另一个相关方面,所述亲本体细胞植物细胞之一包含Cas核酸酶,并且所述亲本体细胞植物细胞中的另一个包含gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas核酸酶在所述预选的内源靶位点内切割DNA。
在另一个相关方面,体细胞植物细胞包含来自两个多态亲本系之间杂交的植物后代的细胞,其产生杂交植物,其中所述亲本植物系各自包含所述预选内源靶位点处的多态性等位基因,并且其中只有一条亲本系包含所述核酸酶系统。
在另一个相关方面,本文公开的方法产生体细胞植物细胞,其包含预选内源靶位点内的靶向同源重组,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,或来源于包含所述体细胞植物细胞的植物或其后代植物的果实,或衍生自包含所述体细胞植物细胞的植物或其子代植物或其任何组合的种子,其具有亲本性状的组合,所述组合不存在于任一亲本中。在另一个方面,亲本性状包括增加的抗旱性、增加的对害虫的抗性、对病原体的增加的抗性、改善的营养物含量、或改善的生长参数、或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状。
在另一个相关方面,核酸酶系统包含Cas核酸酶和gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas核酸酶切割所述预选的内源靶位点内的DNA,并且其中DNA裂解所述核酸酶系统仅在野生型亲本植物细胞中存在的异源等位基因上发生的活性。
在另一个相关方面,体细胞植物细胞包含在植物组织或整株植物中。在另一个相关方面,体细胞植物细胞包含原生质体。在另一个相关方面,体细胞植物细胞包含作物植物细胞。
在另一个相关方面,预选的内源靶位点包含含有基因、基因的一部分或基因的调节上游或下游序列或其任何组合的DNA,并且其中所述基因的表达或缺乏影响生长、抗旱性、对害虫的抗性、对病原体的抗性或营养成分、或对植物细胞、植物组织、植物、果实或种子或其任何组合有益的任何其他性状。在另一个相关方面,预选的内源靶位点包含常染色质或异染色质的区域。
在另一个相关方面,表达包括组成型表达诱导、诱导型表达诱导、组织特异性表达诱导、或条件特异性表达诱导,或其任何组合。
在相关方面,分析所述植物包括分析所述植物或其后代的一部分,所述植物或其后代包含叶、茎、芽、果实、种子。
在相关方面,选择后代的步骤包括F1,F2或F3世代、或任何后续世代、或1至3代的回交、或任何后续的回交世代。
在相关方面,本文公开的方法产生在所述预选的内源靶位点处包含所述靶向同源重组体细胞植物细胞,或在预选的内源靶位点处包含所述靶向同源重组的植物组织,或在预选的内源靶位点包含所述靶向同源重组的植物或其后代植物,或来自在预选的内源靶位点处包含靶向同源重组的植物或其后代植物的果实,或来自在预选的内源靶位点处包含所述靶向同源重组的植物或其子代植物或其任何组合的种子,与对照植物细胞、植物或其后代、果实或种子相比,所述细胞、组织、植物或其子代、果实或种子包含增加的抗旱性、增加的对害虫的抗性、增加的对病原体的抗性、改善的营养含量、改善的生长参数或基因的基因、或任何其他对植物细胞、植物组织、植物或其后代、果实或种子、或其任何组合有益的特征。在相关方面,预选的内源靶位点包含常染色质或异染色质的区域。
另一方面,本文公开了一种植物,其包含通过包含杂合体细胞植物细胞中同源染色体之间的靶向DNA重组的方法产生的有益性状或品质的组合,所述方法包括以下步骤:(a)在所述植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选内源靶位点,其中在所述核酸酶系统表达后,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂;
(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或所述植物的后代,用于同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);
(c)选择其中发生靶向同源重组的植物细胞、其植物组织、植物或其植物后代;
(d)繁殖所述植物细胞、或其植物组织、或其植物、或其植物后代,以产生包含所述靶向同源重组的植物,其中所述植物包含任何杂交体细胞起源的亲本植物中不存在的有益品质或性状的组合。在相关方面,预选的内源靶位点包含常染色质或异染色质的区域。
附图说明
以下附图构成本说明书的一部分并且被包括以进一步说明本公开的某些实施例,通过参考这些附图中的一个或多个并结合本文给出的具体实施例的详细描述,可以更好地理解本文描述的方法。
图1显示了双链断裂(DSB)修复的示意图,其可以通过非同源末端连接(NHEJ)或同源重组(HR)发生。
图2显示了通过同源重组(HR)修复靶向DSB的示意性实施方案。
图3显示了包含诱导同源染色体之间重组的一些实施方案的示意流程图。DNA双链断裂的诱导显示为黄色闪电。
图4A-E显示了番茄果实颜色测定和DNA双链断裂(DSB)修复事件结果的分子分析。图4A:黄色果肉e375635S:Cas9和双色cc383u6-26:Ps#1-sgRNA的交叉:预期Ps#1-sgRNA使Fxplants具有苍白的双色果实表型。选择表达Cas9和gRNA的F1植物。gRNA被设计用于黄色果肉e3756和双色cc383突变(*)之间的两个等位基因中的靶向DSB诱导(显示为黑色闪电)。在双色cc383等位基因的非同源末端连接(NHEJ)修复的情况下,在容易出错的修复之后预期果实颜色为黄色,留下插入缺失(插入/缺失)足迹(蓝线)。在非交叉或交叉的情况下,预期果实颜色为红色或双色,在晚期事件的情况下具有红色斑点。图4B:F1植物和对照中的果实表型分布:双色果实显示为橙色框;黄色水果如黄色的盒子;具有红色部分的水果(假定的体细胞HR)显示为红色交叉阴影框。每个条形代表源自F1植物的果实群,其源自Cas9的独立转基因系和给定的u6-26:Ps#1-sgRNA系之间的杂交。每个交叉中分析的水果数量在黑色条上显示。图4C:NHEJ DSB修复足迹的序列显示在右侧,它们的相对频率显示在饼图中。来自PSY1的CRISPR-Cas靶序列显示在顶部。DSB位置显示为黑色闪电;PSY1起始密码子显示为红色,PAM-原型间隔子相邻基序显示为蓝色。顶部饼图表示来自22个不同的F1植物的Illumina Hiseq读数的平均值:黄色果肉e375635S:Cas9和双色cc383u6-26:Ps#1-sgRNA。在该杂交中,88%的序列偏离WT序列。下饼代表来自2株对照F1群的植物的平均ilummina Hiseq读数(黄色果肉e3756x双色cc383,没有CRISPR-Cas组分)。橙色CTTG缺失是NHEJ的优势足迹。图4D:用于鉴定重组DNA片段的反向PCR方案。(1)首先用Apal(A)和HindIII(H)消化来自单独叶子样品的DNA,然后钝化。(2)每个样品都是自我连接的。(3)通过两种不同的引物组(绿色和黄色)扩增每个样品。Blue-Bicolor等位基因;红色-黄色肉体等位基因;虚线蓝色-双色删除,*-黄色肉体突变,闪电-DSB位点。图4E:单个植物中亲本(P)与重组(R)类型(如从图C获得)的比例。植物1-15-F1黄色果肉e3756 35S:Cas9和双色cc383u6-26:Ps#1-sgRNA的交叉的植物;植物16-合成交叉对照;植物17-18-黄色果肉×双色(Cas9-)F1植物。
图5显示了体细胞中的NHEJ修复。通过对CRISPR-Cas9诱导的DSB(闪电)周围扩增的PCR产物进行测序而获得的NHEJ足迹分布在单个F 1植物和对照植物中(黄色果肉e3756x双色cc383),引物显示为红色箭头。每个饼图表示单株植物的总体ilummina Hiseq读数(每株植物250,000-850,000个读数)。
图6A-6B显示了用于分析生发DNA双链断裂(DSB)修复事件的番茄SNP测定。图6A:将表达35S:Cas9和u6-26:Ps#2-sgRNA的纯合子M82CRISPR突变体(+A,+A)与醋栗番茄LA1578杂交。如果通过NHEJ,非交叉或交叉修复断裂,预计F1将产生没有DNA DSB和黄色果实的红色果实。SNP模式允许区分修复机制。三角形用于SNP;闪电标记DSB位点;蓝线适用于NHEJindels。图6B:F2和F3植株DNA DSB侧翼标记分析。用于醋栗番茄SNP的红色纯合子;用于M82SNP的黄色纯合子(包括+A CRISPR-Cas9突变体);橙色杂合子;空单元格用于丢失数据;闪电-DSB位点。
图7显示了等位基因特异性DNA DSB修复的番茄SNP测定。从M82 35S的4片叶子中提取M8235S:Cas9u6-26:Ps#2-sgRNA psy1+A/psy1+A,醋栗番茄LA1578和他们的F1近交系的5株植物,Illumina测序为预先形成,每个饼代表每株植物600,000-900,000个读数的摘要。
图8显示了使用Illumina测序从果实果皮组织开始和测序DNA DSB修复足迹的果实颜色表型的示意图。显示了植物#1的实例,其是M82 35S:Cas9u6-26:Ps#2-sgRNA psy1+A/psy1+A x醋栗番茄LA1578的F1植物。果实颜色表型从红色到红色变化,小的或大的黄色部分变成黄色。每个饼图是由每个果实15,000-50,000个Illumina测序读数构建的。
图9A和9B显示了等位基因依赖性修复的定量。图9A:在M82背景中培养两种植物种群:一种用于PSY1/PSY1的纯合子和另一种用于PSY1/psy+A基因型的杂合子。这些植物的子代可以在断裂位点(闪电)或任何其他突变(*)产生+A SNP。从两个群体的4周龄植物的叶子中提取DNA,并用Illumina测序。在PSY1/PSY1植物中,可以靶向两个等位基因,而在PSY1/psy+A植物中,仅靶向WT PSY1等位基因。图9B:PSY1/PSY1植物中每个WT等位基因的+A突变百分比作为等位基因非依赖性+A突变的预期值。它通过以下等式计算:预期值=(%(+A读数)T=4周(wt,wt))/2。为了估计当第二等位基因具有+A突变(在M82-WT PSY1/M82psy1+A杂合子植物中)时观察到的+A突变的发生,如图9A所示,使用的等式是:观测值=%(+Areads)T=4周,(wt,+A)-50%。条形对应于22种PSY1/PSY1植物和14种PSY1/psy+A植物的标准误差。平均值之间的差异是显著的(p值(Wilcoxon秩和检验)=0.009)。
图10显示了DNA DSB修复事件,其后是果实表型和果皮特异性Illumina测序-植物#2。所有细节与图8类似。该植物显示出高水平的psy1+A。图6B中的转化产物是该植物的后代。
图11显示了表10,其列出了拟南芥3号染色体上的CRISPR DSB靶标。
图12A-12C显示了在重组热点和冷点处体细胞DNA DSB诱导的拟南芥系统。(图12A)在被认为是GFP和RFP种子标记之间的热点或冷点的区域中的十二个减数分裂重组靶标。热(红色)和冷(蓝色)靶分别具有常染色质或异染色质特征的热点或重组冷点的特征。显示了靶标的坐标及其在GFP和RFP标记之间的染色体3上的分布。图12B显示了实验方案:表达35Sx2的12个纯合子哥伦比亚测试株系:潮霉素,u6-26:gRNA盒,每个编码靶向特定热/冷序列的gRNA,与表达nos:nptII:nos Ubi:spCas9的WT Columbia系杂交。基于F2自受精种子计算重组率,所述F2自受精种子用于计算GFP和RFP标记物左侧之间的交叉率(结果显示在图12C中)。另外,将F1植物与野生型Landsberg植物杂交,并提取来自体细胞组织的DNA,以通过PacBio测序确定体细胞速率和DSB周围DNA DSB修复的机制(结果显示在图13A-13Q中)。(图12C)在X轴上显示的靶上具有热(红色)或冷(蓝色)位点的坐标编号后,在CRISPR-Cas9DSB诱导后GFP和RFP标记之间的CentiMorgan(Y轴)的交叉速率。没有DSB诱导的对照以黑色显示。大红色菱形代表每群的平均交叉率。
图13A-13Q显示了使用Pacbio测序在Hot Target-chr3:1854159处进行DSB修复的分子分析。从幼芽(在减数分裂阶段),Columbia测试者x Landsberg的回交群体的每株植物的茎和上部叶组织中纯化DNA。通过PCR扩增DNA DSB位点侧翼的5kb片段,并使用PacBio测序。使用PacBio Long Amplicon Analysis将行读数聚类到共有序列,然后使用Burrows-Wheeler Aligner(BWA)软件与拟南芥基因组比对,并作图。红色条纹代表哥伦比亚(Col)单核苷酸多态性(SNP),蓝色条带代表Landsberg(Ler)SNP。染色体3上目标#1854179处的DSB位点显示为虚线。黄线表示DSB位点的NHEJ足迹。绿线表示不属于任何父母的序列。对于每种植物(图13A-13Q,其中每个盒子是不同的植物,图13O-13Q是对照植物),提取的DNA被条形码化(具有指示的条形码的单独的正方形)数百或数千个单个分子被测序和聚类,根据序列(包括SNPs模式)。该方法允许区分每个分子的亲本来源。在一些植物中(例如左上方的条形码89),没有任何变化的证据,并且亲本等位基因或多或少地具有相同的比例。在其他植物中(例如条形码90-第二植物顶部,从左侧开始),有证据表明断裂位于断裂侧翼,如10-12%的分子中红色到蓝色SNP的转变所示。还对F1Ler x Col测试仪的三个对照植物进行测序并以相同方式分析,并且未显示任何交叉或基因转换事件。
具体实施方式
在以下详细描述中,阐述了许多具体细节以便提供对本文提出的方法的透彻理解。然而,本领域技术人员将理解,可以在没有这些具体细节的情况下实施这些靶向体细胞植物细胞或其组织或植物中的同源染色体之间的DNA重组的方法。在其他情况下,没有详细描述公知的方法,程序和组分,以免模糊包含靶向同源重组的DNA的方法和由此产生的植物细胞及其植物,如本文所公开的。
在一个实施方案中,本文公开了一种在体细胞植物细胞中的同源染色体之间靶向DNA重组的方法,所述方法包括以下步骤:(a)在所述植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含所述同源染色体上的多态性等位基因的预选的内源靶位点,其中在表达所述核酸酶系统时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂;(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或其所述植物的后代,用于所述同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);(c)选择其中发生靶向同源重组的植物细胞、其植物组织、其植物、或其植物后代。
在一个实施方案中,本文公开的方法产生一种植物,其包含通过包括在杂交体细胞植物细胞中的同源染色体之间的靶向DNA重组的方法产生的有益性状或品质的组合,所述方法包括以下步骤:(a)在所述植物细胞中表达核酸酶系统,其中所述表达核酸酶系统靶向包含同源染色体上的多态性等位基因的预选的内源靶位点,其中在所述核酸酶系统表达时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA从而在至少一个所述多态性等位基因的DNA中产生双链断裂;(b)分析所述植物细胞的后代、或从所述植物细胞生长的植物组织、或从所述细胞生长的植物或其所述植物的后代,用于同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);(c)选择其中发生靶向同源重组的植物细胞、其植物组织、其植物或其植物后代;(d)繁殖所述植物细胞或其植物组织或其植物或其植物后代以产生包含所述靶向同源重组的植物,其中所述植物包含任一所述杂交体细胞起源的亲本植物中不存在的有益品质或性状的组合。
在一个实施方案中,本文公开产生包含有益性状或品质组合的后代植物的方法,其中所述组合不存在于任一亲本植物中,所述方法包括:(a)选择亲本植物,其中每个所述亲本包含至少一种有益性状,其中所述有益性状不相同,并且其中所述亲本对于一种所述至少有益的性状是多态性的;(b)杂交所述亲本植物以建立杂交植物;(c)从所述杂交植物中收集体细胞;(d)在所述体细胞性细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选的内源靶位点,其中在所述核酸酶系统表达时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内切割,其中所述核酸酶切割DNA从而在至少一个所述多态性等位基因的DNA中产生双链断裂,其中在所述靶向预选的内源靶标处的同源交叉或基因转换(非交叉)位点导致表达或调节至少一种所述有益性状或品质的表达的DNA交换;(e)分析所述植物细胞的后代、或从所述植物细胞生长的植物组织、或从所述细胞生长的植物或其所述植物的后代,用于所述交叉或基因转换(非交叉)事件,其中表达所述性状组合;(f)选择其中表达所述性状组合的植物细胞、其植物组织、其植物或其植物后代;(g)繁殖所述植物细胞、其植物组织、其植物,以产生包含所述有益性状或品质组合的后代植物。
在一个实施方案中,植物细胞是分离的植物细胞。在另一个实施方案中,植物细胞包含在植物组织中。在另一个实施方案中,植物细胞包含在整株植物中。本领域普通技术人员将理解,在整个术语“植物细胞”中的使用在不同的实施方案中包括分离的植物细胞,植物组织中包含的植物细胞,或包含在整株植物中的植物细胞,或其组合。
在一些实施方案中,本文描述的植物细胞的来源来自野生型植物。在一些实施方案中,植物细胞的来源来自栽培植物,所述栽培植物已被选择用于可通过繁殖维持的所需特征。栽培植物也可称为栽培种,尽管一些栽培种在野外出现。
本领域普通技术人员将理解,靶向同源染色体之间DNA重组的方法是体细胞植物细胞,如本文所述,可包括用于精确育种作物的用途。
在一些实施方案中,靶向同源染色体之间DNA重组的方法导致特定等位基因或其部分的缺失。在一些实施方案中,等位基因编码多肽,其表达提供对植物或植物产品有益的性状或品质,例如水果或花。在一些实施方案中,等位基因编码多肽,其表达增强植物中的有益性状或品质。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致添加特定等位基因或其部分。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致在等位基因内引入DNA突变。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致一个等位基因取代另一个等位基因。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致缺失等位基因的调节上游基因序列。在一些实施方案中,靶向同源染色体之间的DNA重组的方法导致等位基因的下游基因序列的缺失。在一些实施方案中,靶向同源染色体之间的DNA重组的方法导致添加等位基因的调节上游基因序列。在一些实施方案中,靶向同源染色体之间的DNA重组的方法导致等位基因的下游基因序列。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致调节上游基因序列的突变。在一些实施方案中,靶向同源染色体之间DNA重组的方法产生下游基因序列。在一些实施方案中,靶向同源染色体之间的DNA重组的方法导致特定等位基因或其部分的缺失或特定等位基因或其部分的添加或等位基因内的DNA突变的引入或一个等位基因的替换以用于另一个等位基因或缺失。等位基因的调节上游基因序列或等位基因的下游基因序列的缺失或等位基因的调节上游基因序列或等位基因的调节下游基因序列或调节突变的添加上游基因序列或调节性下游基因序列,或其等位基因的任意组合。
在一些实施方案中,同源染色体之间靶向DNA重组的方法导致等位基因置换。在一个实施方案中,等位基因替换包括用内源基因座处的突变等位基因替换野生型基因。在另一个实施方案中,等位基因置换包括用内源基因座处的野生型等位基因替换突变等位基因。在另一个实施方案中,等位基因置换包括用内源基因座处的不同突变等位基因替换突变等位基因。在一些实施方案中,等位基因置换导致植物细胞,其组织,植物或其子代的有益性状或品质的表达。本文公开的用于等位基因置换的方法的优点是不需要开发包含置换等位基因的外源核酸序列,例如包含置换等位基因的载体。等位基因材料的交换在细胞中的同源染色体之间,其中染色体包含多态性等位基因。
在一些实施方案中,同源染色体之间靶向DNA重组的方法导致单核苷酸多态性(SNP)置换。在一个实施方案中,SNP替代包括在基因中产生错义突变。在另一个实施方案中,SNP替换包括将错义突变与野生型核苷酸置于一起。在另一个实施方案中,SNP置换包括在基因中产生错义突变,其增强编码的多肽的功能。在另一个实施方案中,SNP替代包括在基因中产生错义突变,其降低编码的多肽的功能。在另一个实施方案中,SNP替代包括在基因中产生错义突变,其增强编码的多肽的表达。在另一个实施方案中,SNP置换包括在基因中产生错义突变,其降低编码的多肽的表达。在一些实施方案中,SNP置换导致植物细胞,其组织,植物或其子代的有益性状或质量的表达。本文公开的用于SNP替换的方法的优点在于不需要开发包含替代SNP的外源核酸序列,例如包含替代SNP的载体。包含SNP的核酸序列的交换在细胞中的同源染色体之间,其中染色体包含多态性等位基因。
在一些实施方案中,靶向同源染色体之间DNA重组的方法导致单个基因座通过同源重组(HR)从一个染色体转移至其同源物,其中在后代植物细胞中产生新的所需性状组合。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致单个基因座通过同源重组(HR)从一个染色体转移至其同源物,其中在后代植物组织中产生新的所需性状组合。在一些实施方案中,靶向同源染色体之间DNA重组的方法导致单个基因座通过同源重组(HR)从一个染色体转移至其同源物,其中在后代植物中产生新的所需性状组合。在一些实施方案中,单个基因座的转移包括通过同源重组(HR)将染色体片段从一条染色体重组为其同源物,其中在后代植物细胞中产生新的所需性状组合。在一些实施方案中,单个基因座的转移包括通过同源重组(HR)将染色体片段从一条染色体重新洗脱至其同源物,其中在后代植物组织中产生新的所需性状组合。在一些实施方案中,单个基因座的转移包括通过同源重组(HR)将染色体片段从一个染色体重组为其同源物,其中在后代植物中产生新的所需性状组合。在一些实施方案中,性状的组合不存在于任一亲本中。
在一些实施方案中,基因座包含等位基因。在一些实施方案中,基因座包含等位基因的一部分。在一些实施方案中,基因座包含等位基因的上游序列。在一些实施方案中,基因座包含等位基因的下游序列。在一些实施方案中,基因座包含等位基因内的单个SNP。在一些实施方案中,基因座包含等位基因内的多个SNP。在一些实施方案中,基因座包含连续核酸序列,其包含等位基因,等位基因的上游序列,等位基因的下游序列,等位基因的调节序列,或等位基因内的SNP,或其任何组合。
通过自然重组难以获得新的期望性状或性状组合的产生,例如在植物培养期间,其中重组不针对特定基因座,并且在特定基因座处的重组发生小于105-106每自然重组事件。
在一个实施方案中,单个基因座包含基因。在一个实施方案中,单个基因座包含等位基因。在一个实施方案中,单个基因座包含基因的一部分。在一个实施方案中,单个基因座包含等位基因的一部分。在一个实施方案中,单个基因座包含基因启动子。在一个实施方案中,单个基因座包含基因外显子。在一个实施方案中,单个基因座包含至少一个基因的外显子。在一个实施方案中,单个基因座包含至少两个基因外显子。在一个实施方案中,单个基因座包含至少三个基因外显子。在一个实施方案中,单个基因座包含基因内含子。在一个实施方案中,单个基因座包含至少一个基因的内含子。在一个实施方案中,单个基因座包含至少两个基因内含子。在一个实施方案中,单个基因座包含至少三个基因内含子。在一个实施方案中,单个基因座包含基因的至少一个外显子和一个内含子。在一个实施方案中,单个基因座包含基因的外显子和内含子的任何组合。在一个实施方案中,单个基因座包含编码小RNA的DNA序列。在一个实施方案中,单个基因座包含编码微RNA的DNA序列。在一个实施方案中,单个基因座包含编码tRNA的DNA序列。在一个实施方案中,单个基因座包含编码基因调控序列或调控序列的DNA序列。
在一个实施方案中,同源染色体之间靶向重组的方法导致特定等位基因或其部分的缺失。在另一个实施方案中,同源染色体之间靶向重组的方法导致添加特定等位基因或其部分。在另一个实施方案中,同源染色体之间靶向重组的方法导致在等位基因内引入DNA突变。在另一个实施方案中,同源染色体之间靶向重组的方法导致一个等位基因取代另一个等位基因。在另一个实施方案中,同源染色体之间的靶向重组的方法导致缺失等位基因的调节上游或下游基因序列。在另一个实施方案中,同源染色体之间的靶向重组的方法导致添加等位基因的调节上游或下游基因序列。在另一个实施方案中,同源染色体之间的靶向重组的方法导致调节上游或下游基因序列的突变。
在另一个实施方案中,突变包括点突变、缺失突变、取代突变或插入突变,或其任何组合。在另一个实施方案中,同源染色体之间靶向重组的方法导致点突变。在另一个实施方案中,同源染色体之间靶向重组的方法导致缺失突变。在另一个实施方案中,同源染色体之间靶向重组的方法导致取代突变。在另一个实施方案中,同源染色体之间靶向重组的方法导致插入突变。
在一些实施方案中,本文公开的方法“敲除”基因,其中技术人员将理解“敲除”基因包括使植物基因组内的基因失效。在一些实施方案中,基因敲除导致在植物中表达有益的品质或性状。在一些实施方案中,基因敲除导致植物中有益品质或性状的表达增加。在一些实施方案中,基因敲除导致植物中负质量或性状的表达降低。在一些实施方案中,基因敲除导致植物中缺乏非有益品质或性状的表达。在一些实施方案中,敲除交换基因的多态性等位基因。
在一些实施方案中,本文公开的方法“敲入”基因,其中技术人员将理解,“敲入”基因包括使植物基因组内的基因在其中先前未表达。在一些实施方案中,基因敲入导致在植物中表达有益的品质或性状。在一些实施方案中,基因敲入导致植物中有益品质或性状的表达增加。在一些实施方案中,基因敲入导致植物中负质量或性状的表达降低。在一些实施方案中,基因敲入导致植物中缺乏非有益品质或性状的表达。在一些实施方案中,敲入交换基因的多态性等位基因。
技术人员会理解“同源重组”包括遗传重组的机制,其中包含相似核苷酸序列的两条DNA链交换遗传物质。细胞在减数分裂期间使用同源重组,其用于重排DNA以产生完全独特的单倍体染色体组。体细胞可以使用同源重组来修复受损的DNA,特别是用于修复双链断裂(DSB)。在一个实施方案中,如本文所述,诱导同源重组发生在包含体细胞中的多态性等位基因的同源染色体之间。同源重组事件可用于以多种方式改变内源基因。在一些实施方案中,同源重组可导致基因转换(非交换)。在一些实施方案中,同源重组可导致内源基因的失活。在一些实施方案中,同源重组可以产生衍生自两个相关基因的重组基因座,例如等位基因。在一个实施方案中,新产生的重组等位基因与衍生它的任一基因相比具有新的活性。DNA中甲基化模式的变化可能导致基因或基因表达的变化。在某些情况下,这可能是有益的,而在其他情况下,已显示甲基化模式的变化涉及疾病状态,例如癌症。在一些实施方案中,本文公开的靶向同源重组的方法可以导致表观遗传水平的甲基化改变,即甲基化模式的改变。在其他实施方案中,靶向同源重组的方法不会导致表观遗传水平的甲基化变化,即甲基化模式没有变化。
在一些实施方案中,体细胞中同源染色体之间的靶向DNA重组,其中用于重组的靶位点包含多态性等位基因,是可遗传的,其中重组事件传递给后代。因此,一旦分析并选择从细胞繁殖的植物细胞,植物组织或从细胞繁殖的植物作为包含靶向同源重组事件,就可以产生包含该靶向重组事件的后代。在一个实施方案中,重组事件可通过种子经由种子繁殖,所述植物从包含本文公开的靶向DNA重组的细胞或组织繁殖。在另一个实施方案中,重组事件可通过再生含有重组事件的营养组织而遗传。在另一个实施方案中,重组事件可通过繁殖含有遗传事件的营养组织而遗传。包含本文公开的重组事件的营养组织的繁殖的非限制性实例包括使用包含重组事件的分支来进行树木切割或用于移植到树上,以及使用包含重组事件的愈伤组织来再生香蕉植物。
DNA DSB可以作为改变和控制植物基因组的有力工具。在植物中,大多数DNA双链断裂将由NHEJ机器修复,这通常在断裂位点留下小的Indel。(图1)断裂也可以通过同源重组(HR)修复。(图1,图2和图3右侧)。在一个实施方案中,当通过合成依赖性链退火解决HR时,结果是基因转变(基因座从一条染色体转移到另一条染色体;也称为非交换事件)。在另一个实施方案中,当通过Holliday连接的形成解决HR时,结果是基因转换事件或交叉事件,这取决于Holliday连接如何被解析。技术人员会理解,同源染色体之间的同源重组“交换”事件包括DNA序列之间的链交换。在一个实施方案中,交换事件包括在包含基本相似的核苷酸组成的DNA序列之间的交换。在另一个实施方案中,交换事件包括在包含多态性等位基因的同源染色体的DNA序列之间的交换,其中交换事件包括包含多态性等位基因的DNA序列之间的链交换。换句话说,通过包含多态性等位基因的同源染色体的交换进行的同源重组可以导致DNA序列的延长交换,其中该序列包含含有不同核苷酸组成的序列。此外,在另一个实施方案中,同源重组交换事件提供了侧接DSB的DNA序列的交换。
在一些实施方案中,本文公开的内源靶位点内的靶向同源重组的方法包括连续DNA序列的交换,其中所述连续DNA序列包含约0.01KB-20KB的DNA。在一些实施方案中,本文公开的内源靶位点内靶向同源重组的方法包括连续DNA序列的交换,其中所述连续DNA序列包含约0.1KB-20KB的DNA。在一些实施方案中,本文公开的内源靶位点内靶向同源重组的方法包括连续DNA序列的交换,其中所述连续DNA序列包含约1KB-20KB的DNA。
在一些实施方案中,靶向同源重组的方法包括约1KB-5KB的交换。在一些实施方案中,靶向同源重组的方法包括约5KB-10KB的交换。在一些实施方案中,靶向同源重组的方法包括约10KB-15KB的交换。在一些实施方案中,靶向同源重组的方法包括约15KB-20KB的交换。
在一些实施方案中,靶向同源重组的方法包括至少约1KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约2KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约3KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约4KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约5KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约6KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约7KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约8KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约9KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约10KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约11KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约12KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约13KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约14KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约15KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约16KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约17KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约18KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约19KB的交换。在一些实施方案中,靶向同源重组的方法包括至少约20KB的交换。
图2示意性地展示了如何将靶向断裂修复用作精确的育种工具。这些休息的修复产品对于育种非常有用。在一个实施方案中,同源重组用于将来自野生型植物品种的性状递送到已知栽培种中。在另一个实施方案中,同源重组用于将具有特定性状的一种已知栽培种的性状递送到缺乏特定性状的第二种已知栽培种中。在一些实施方案中,通过同源重组进行的DSB修复“打破”涉及重要性状的2个基因的非常紧密的遗传连锁。例如:当涉及抗病性的基因(图2“R”)位于参与高产量生产的基因旁边时(图2“Y”),天然存在的减数分裂交叉可能非常低。诱导这两个基因之间的目标DSB,蓝色染色体上的Yr和红色染色体上的yR之间,然后进行同源交叉修复将在两个连锁性状之间解离,从而能够在后代中产生新的重组组合,具有高产量和对该疾病的抗性。这也可以最大限度地减少可能含有不需要的基因的野生型品种的染色体片段的长度。
在一个实施方案中,如本文所公开的同源染色体之间的靶向重组方法不同于通过同源重组进行基因靶向的方法,所述同源重组涉及通过同源重组在基因组和外源脱氧核糖核酸(DNA)分子之间交换遗传信息。在另一个实施方案中,如本文所公开的同源染色体之间的靶向重组方法不涉及或不需要或使用DNA的外源同源片段作为同源重组的模板。
与本领域已知的基因靶向方法相比,本文所述的方法是有利的,其需要外源DNA片段作为模板,用于通过同源重组在基因组和外源脱氧核糖核酸(DNA)分子之间交换遗传信息。另一个优点是可以产生后代植物组织和完整植物的所得植物细胞不是转基因的。在一个实施方案中,使用本文所述方法产生的后代植物细胞,植物组织或完整植物不包含来自核酸酶系统的外源DNA,其可以被消除,例如通过遗传分离或可以通过瞬时表达提供。本文所述的靶向同源重组模拟同源重组的自然现象,但由于靶向DSB,重组DNA事件的目标是交换例如有利的性状。使用本文所述的靶向重组方法获得包含所需事件的植物的另一个优点是需要筛选数万种植物以鉴定包含天然(非诱导/非靶向)同源的特定性状交换的植物。重组。与使用外源DNA的方法相比的另一个优点是,已经显示外源DNA可以改变插入位点处的DNA甲基化模式。在一个实施方案中,本文公开的靶向重组方法改变基因转换位点处的DNA甲基化模式。在另一个实施方案中,本文公开的靶向重组方法改变交叉位点处的DNA甲基化模式。在一个实施方案中,本文公开的靶向重组方法不改变基因转换位点处的DNA甲基化模式。在另一个实施方案中,本文公开的靶向重组方法不改变交叉位点处的DNA甲基化模式。
在一个实施方案中,本文公开的方法与体细胞植物细胞一起使用。技术人员会理解,体细胞植物细胞包括除生殖细胞外的任何植物细胞。在另一个实施方案中,体细胞植物细胞选自根细胞,根状细胞,鳞茎细胞,干细胞,叶细胞,芽细胞,种子荚细胞或果实细胞。在一些实施方案中,通过本文公开的方法制备的体细胞植物细胞可以在本领域已知的适当条件下生长,以产生包含含有靶向HR事件的DNA的植物组织,例如基因转换或交换事件。在一个实施方案中,植物组织包含根组织,根状茎组织,鳞茎组织,茎组织,叶组织,芽组织,块茎组织,树木切割,植物愈伤组织,种子或种子荚。或水果组织,或其任何组合。在另一个实施方案中,从通过本文公开的方法制备的植物细胞生长的植物组织可用于产生后代植物,例如,在嫁接的情况下,切割可用于产生树或树的一部分。
在一些实施方案中,使用本文公开的方法包含靶向DNA重组的体细胞植物细胞可以在本领域已知的适当条件下生长,以产生完整植物,其中所述植物包含所得的靶向DNA重组。
在另一个实施方案中,包含所得靶向DNA重组的完整植物包含整个植物组织中的重组DNA。在另一个实施方案中,整个植物在植物的仅一部分中的组织中包含重组DNA。例如,在另一个实施方案中,整个植物在果实中包含重组DNA。在另一个实施方案中,整个植物包含种子中的重组DNA。在另一个实施方案中,整个植物包含种子荚中的重组DNA。在另一个实施方案中,整个植物包含花粉中的重组DNA。在另一个实施方案中,整个植物包含叶中的重组DNA。在另一个实施方案中,整个植物包含根组织中的重组DNA。在另一个实施方案中,整个植物包含在根状组织中的重组DNA。在另一个实施方案中,整个植物包含球茎组织中的重组DNA。在另一个实施方案中,整个植物包含茎中的重组DNA。在另一个实施方案中,整个植物在芽中包含重组DNA。在另一个实施方案中,整个植物包含水果,种子,种子荚,叶,根组织,根状茎组织,鳞茎组织,茎或芽或其任何组合中的重组DNA。
在一些实施方案中,体细胞植物细胞包含原生质体。本领域技术人员将理解,原生质体包括已经部分或完全除去其保护性细胞壁的植物细胞,例如通过酶处理,产生可以再生细胞壁并进一步生长成活细胞壁的完整生物化学感受态单位。在适当的生长条件下的整株植物。植物的细胞壁也可以使用机械处理部分或完全除去,其中活植物的完整生化活性单位是能够在适当的生长条件下再生细胞壁并进一步生长成完整植物的产物。
在一些实施方案中,本文公开的制备包含DNA的体细胞植物细胞的方法,其包含本文公开的靶向同源重组事件,其中所述植物细胞包含原生质体,可通过在已知的适当生长条件下培养原生质体来用于制备植物组织。在本领域中,为了再生细胞壁然后生长植物组织。在一些实施方案中,本文公开的制备包含DNA的体细胞植物细胞,其包含本文公开的靶向同源重组事件,其中所述植物细胞包含原生质体,可通过在已知的适当生长条件下培养原生质体来用于制备整株植物。在本领域中,为了再生细胞壁然后使整个植物生长。
在一些实施方案中,本文描述的方法使用同源染色体之间的靶向重组。本领域技术人员将理解,术语同源染色体包括染色体,其含有相同生物学特征的信息并且在相同基因座处含有相同的基因但可能是这些基因的不同等位基因。在一些实施方案中,同源染色体包含染色体,所述染色体含有相同生物学特征的信息并且在相同基因座处含有相同基因但对这些基因具有不同的甲基化模式,这可能影响基因的表达水平。
技术人员会理解,术语“等位基因”可以包括特定基因座处的基因的一种或多种替代形式中的任何一种。在植物的二倍体(或双二倍体)细胞中,给定基因的等位基因位于染色体上的特定位置或基因座(基因座复数)。在该对同源染色体的每条染色体上存在一个等位基因。在一个实施方案中,多态性等位基因包含在相应的染色体基因座处不相似的等位基因。术语“多态性等位基因”可与具有所有相同含义和质量的“异源等位基因”或“杂合等位基因”互换使用。
此外,技术人员将理解,术语“基因座”(基因座复数)包括染色体上的特定位置或位点,例如发现基因或遗传标记。在一些实施方案中,基因座包含在常染色体DNA的区域内。在一些实施方案中,预选的内源靶位点包含异染色DNA区域。在一些实施方案中,预选的内源靶位点包含常染色体DNA或异染色质DNA的区域。
在一些实施方案中,预选的内源靶位点包含染色体上发现基因或遗传标记的基因座。在另一个实施方案中,预选的内源靶位点包含基因的外显子。在另一个实施方案中,预选的内源靶位点包含基因的内含子。在另一个实施方案中,预选的内源靶位点包含基因的多个外显子和内含子。在另一个实施方案中,预选的内源靶位点包含含有至少一个外显子和一个内含子之间的边界的区域。在另一个实施方案中,预选的内源靶位点包含上游调节序列。在另一个实施方案中,预选的内源靶位点包含下游调节序列。在另一个实施方案中,预选的内源靶位点包含位于基因座内的调节序列。在另一个实施方案中,预选的内源靶位点包含上游序列。在另一个实施方案中,预选的内源靶位点包含下游序列。
在一些实施方案中,预选的内源靶位点包含常染DNA区域。在一些实施方案中,预选的内源靶位点包含异染色DNA区域。在一些实施方案中,预选的内源靶位点包含常染色体DNA或异染色质DNA的区域。
本领域技术人员会理解,植物染色体具有高度浓缩的,即着丝粒异染色质和大部分去浓缩的常染色臂。异染色质通常与转录不活动和抑制的遗传重组有关。然而,虽然异染色质与常染色质相比可能是基因差的,但它仍含有转录活性基因。在植物中,除了位于着丝粒和着丝粒区域的异染色质外,异染色质位于核仁组织器,瘤节和玉米(Zea mays)B染色体上。在植物基因组内,已经在异染色质中鉴定了潜在活性基因的位置,例如结构结构和在着丝粒区域。然而,虽然异染色质与常染色质相比可能是基因差的,但它仍含有转录活性基因。以下实施例5中给出的令人惊讶的结果表明,本文公开的用于在体细胞植物细胞中同源染色体之间的位点特异性靶向DNA重组的方法,对于常染色质和意外的异染色质都起作用,其中通常抑制重组。
在另一个实施方案中,将本文公开的核酸酶引导至预选的内源靶位点内的区域,其中所述靶向区域长度包含约20bp。在另一个实施方案中,靶向区域长度包含约30bp。在另一个实施方案中,靶向区域长度包含小于20bp。在另一个实施方案中,DSB的靶向区长度包含大于20bp。在一些实施方案中,将本文公开的核酸酶引导至靶区域以产生DSB。
在一些实施方案中,预选的内源靶位点包含多态性等位基因。在一些实施方案中,预选的内源靶位点与多态性等位基因相邻。在一些实施方案中,预选的内源靶位点位于多态性等位基因的上游。在一些实施方案中,预选的内源靶位点位于多态性等位基因的下游。
在一些实施方案中,同源染色体之间的靶向同源重组包括由存在于植物细胞基因组中的同源染色体上存在的同源序列引导的DNA交换,并通过细胞的酶促机制起作用(图3;图4A;图6A)。在一个实施方案中,DNA的交换包括在预选的内源靶位点内的DNA。在另一个实施方案中,DNA的交换包括但不限于预选的内源靶位点内的DNA。在另一个实施方案中,DNA的交换包括预选的内源靶位点内的DNA和与预选的内源靶位点相邻的DNA。在另一个实施方案中,DNA的交换包括含有整个预选的内源靶位点的DNA。在另一个实施方案中,DNA的交换包括含有整个预选的内源靶位点的DNA和与预选的内源靶位点相邻的DNA。在另一个实施方案中,DNA的交换包括仅包含预选的内源靶位点的一部分的DNA。在另一个实施方案中,DNA的交换包括仅包含预选的内源靶位点的一部分和与预选的内源靶位点相邻DNA的DNA。在另一个实施方案中,DNA的交换包括DSB的DNA 3'。在另一个实施方案中,DNA的交换包括DNA5'到DSB。
在一些实施方案中,本文所述方法中使用的植物细胞具有基因和/或其调节元件的突变,这是DSB后非同源末端连接(NHEJ)途径所需的。同源DNA修复。例如,在一些实施方案中,植物细胞可具有ku基因突变(例如,ku70和/或ku80)。在一些实施方案中,植物细胞可具有lig4中的突变。在一些实施方案中,植物细胞可以在任何基因或调节元件中具有突变,其中该突变将导致DSB后NHEJ修复的减少。
图3示意性地显示了诱导同源染色体之间同源重组的方法的一些实施方案,所述同源染色体例如植物细胞,植物组织或整株植物中的同源染色体。在体细胞(例如植物细胞)的基因组中同源染色体之间靶向重组的方法包括三个步骤:(1)在植物细胞中表达核酸酶系统;(2)在预选位点的一个或两个等位基因中诱导DNA双链断裂;(3)通过同源染色体之间的重组修复DNA。在一个实施方案中,本文公开了靶向体细胞植物细胞中同源染色体之间DNA重组的方法,该方法包括以下步骤:(a)在植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向预选的包含同源染色体上的多态性等位基因的内源靶位点,其中在核酸酶系统表达时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割DNA产生双链断裂(DSB)在至少一个多态性等位基因的DNA中;(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞或其所述植物的后代生长的植物的后代,用于同源染色体之间的同源重组,其中同源重组包括交叉或基因转换(非交叉);(c)选择包含含有所述靶向同源重组事件的DNA的植物细胞,其植物组织,其植物或其植物后代。
图3-步骤1:核酸酶系统的表达。待表达的核酸酶系统可包含能够将双链切割活性靶向同源染色体的至少一个等位基因的DNA中的预选位点的任何核酸酶系统。
例如,在一些实施方案中,本文公开的方法中使用的核酸酶系统包含锌指核酸酶(ZFN)系统,转录激活因子样效应物核酸酶(TALEN)系统,或簇状规则间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)系统。在其他实施方案中,本文公开的方法中使用的核酸酶系统包含能够靶向能够将DNA双链切割至DNA上的预选位点的核酸酶的任何核酸酶系统。在另一个实施方案中,核酸酶系统包含细菌Argonaut和DNA指导。在另一个实施方案中,双链核酸酶切割DNA以产生平末端。在另一个实施方案中,双链核酸酶切割DNA以产生锯齿状切割末端。
在另一个实施方案中,双链核酸酶切割多态性等位基因内的DNA。在另一个实施方案中,双链核酸酶切割多态性等位基因上游的DNA。在另一个实施方案中,双链核酸酶切割多态性等位基因下游的DNA。在另一个实施方案中,核酸酶系统包含锌指核酸酶(ZFN),其中ZFN可以是本领域已知的或新产生的以切割预选位点。在另一个实施方案中,核酸酶系统包含转录激活因子样效应物核酸酶(TALEN),其中TALEN可以是本领域已知的或新产生的以切割预选位点。在另一个实施方案中,核酸酶系统包含聚集的规则间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)系统(CRISPR/Cas),其中sgRNA和/或Cas可以是本领域已知的或新产生的在预选的位点上用于切割。
技术人员将理解,术语“单指导RNA”,“sgRNA”和“gRNA”是可互换的,具有所有相同的品质和含义,其中sgRNA可以包含由CRISPR RNA组成的嵌合RNA分子(crRNA)和反式编码的CRISPR RNA(tracrRNA)。在一些实施方案中,crRNA与至少一个同源染色体上的预选内源靶位点内的DNA区域互补,其中crRNA将CRISPR相关多肽(Cas)核酸酶蛋白“靶向”预选的内源靶位点。
在一个实施方案中,crRNA序列互补的长度为19-22个核苷酸长,例如与靶标互补的19-22个连续核苷酸。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为约15-30个核苷酸长。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为20个核苷酸长。在一个实施方案中,crRNA位于sgRNA分子的5'末端。在另一个实施方案中,crRNA在预选的靶序列内包含100%互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少80%的互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少85%的互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少90%的互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少95%的互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少97%的互补。在另一个实施方案中,crRNA在预选的靶序列内包含至少99%的互补。
在另一个实施方案中,tracrRNA长100-300个核糖核苷酸,并提供Cas核酸酶的结合位点,例如形成CRISPR/Cas9复合物的Cas9蛋白。
在一个实施方案中,核酸酶系统包含锌指核酸酶(ZFN),其包含锌指DNA结合结构域和DNA核酸酶切割结构域,其中所述锌指DNA结合结构域结合在所述预选的内源靶位点内,从而靶向DNA核酸酶切割结构域在所述预选的内源靶位点内切割DNA。
本领域技术人员将理解,术语“锌指核酸酶”或“ZFN”是可互换的,具有所有相同的含义和质量,其中ZFN包含嵌合蛋白分子,其包含至少一个与至少一个可操作地连接的锌指DNA结合结构域。能够双链切割DNA的核酸酶。在一个实施方案中,锌指核酸酶在预选的内源靶位点处产生双链断裂。在另一个实施方案中,锌指核酸酶包含DNA结合结构域和DNA切割结构域,其中DNA结合结构域包含至少一个锌指并且与DNA切割结构域可操作地连接。在另一个实施方案中,锌指DNA结合结构域位于嵌合蛋白分子的N-末端,DNA-切割结构域位于分子的C-末端。在另一个实施方案中,锌指DNA结合结构域位于嵌合蛋白分子的C-末端,DNA-切割结构域位于分子的N-末端。在另一个实施方案中,锌指结合结构域包括锌指核酸酶中能够结合靶基因座的区域,例如本文公开的预选的内源靶位点。在另一个实施方案中,锌指DNA结合结构域包含与至少一个同源染色体上的预选内源靶位点结合的蛋白结构域。在另一个实施方案中,锌手指DNA结合结构域包含与至少一个同源染色体上的多态性等位基因结合的蛋白质结构域。在另一个实施方案中,锌指DNA结合结构域包含与两个同源染色体上的预选内源靶位点结合的蛋白结构域。在另一个实施方案中,锌指DNA结合结构域包含与两条同源染色体上的多态性等位基因结合的蛋白结构域。
技术人员会理解,术语“嵌合蛋白”用于描述已经通过可操作地连接两个或多个DNA片段而产生的DNA分子表达的蛋白质。DNA片段可以来自相同的物种,或者它们可以来自不同的物种。DNA片段可以来自相同或不同的基因。
技术人员将理解,ZFN的术语“DNA切割结构域”包括锌指核酸酶中能够分解核苷酸链中核酸之间的化学键的区域。含有切割结构域的蛋白质的实例包括限制酶、拓扑异构酶、重组酶、整合酶和DNA酶
在一个实施方案中,核酸酶系统包含转录激活因子样效应物核酸酶(TALEN)系统,其包含TAL效应物DNA结合结构域和DNA切割结构域,其中所述TAL效应物DNA结合结构域结合在所述预选的内源靶位点内,从而靶向DNA切割结构域在所述预选的内源靶位点内切割DNA。
本领域技术人员将理解,术语“转录激活因子样效应物核酸酶”,“TALEN”和“TAL效应物核酸酶”可以互换使用,具有所有相同的含义和质量,其中TALEN包含能够识别和切割的核酸酶。其靶位点,例如本文公开的预选的内源靶位点。在另一个实施方案中,TALEN包含融合蛋白,所述融合蛋白包含TALE结构域和核苷酸切割结构域。在另一个实施方案中,TALE结构域包含通过一个或多个TALE-重复模块以序列特异性方式结合核苷酸的蛋白质结构域。在另一个实施方案中,TALE结构域包含与至少一个同源染色体上的预选内源靶位点结合的蛋白质结构域。在另一个实施方案中,TALE结构域包含与至少一个同源染色体上的多态性等位基因结合的蛋白质结构域。在另一个实施方案中,TALE结构域包含与两条同源染色体上的预选内源靶位点结合的蛋白质结构域。在另一个实施方案中,TALE结构域包含与两条同源染色体上的多态性等位基因结合的蛋白质结构域。
在一个实施方案中,TALE结构域包含至少一个TALE-重复模块。在另一个实施方案中,TALE结构域包含一至三十个TALE-重复模块。在另一个实施方案中,TALE结构域包含超过30个重复模块。
在另一个实施方案中,TALEN融合蛋白包含N-末端结构域,一个或多个TALE-重复模块,接着是半重复模块,接头和核苷酸切割结构域。
在一个实施方案中,核酸酶系统包含CRISPR/Cas系统。在另一个实施方案中,CRISPR/Cas系统包含Cas核酸酶和gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas核酸酶在所述预选的内源靶位点内切割DNA。
在一些实施方案中,CRISPR Cas系统包含酶系统,其包括指导RNA序列(“gRNA”或“sgRNA”),其含有与靶多核苷酸的区域互补或基本上互补的核苷酸序列,例如预选的内源靶位点。和具有核酸酶活性的蛋白质。
在另一个实施方案中,CRISPR/Cas系统包含I型CRISPR-Cas系统,或II型CRISPR-Cas系统,或III型CRISPR-Cas系统,或其衍生物。在另一个实施方案中,CRISPR-Cas系统包含衍生自天然存在的CRISPR-Cas系统的工程化和/或程序化的核酸酶系统。在另一个实施方案中,CRISPR-Cas系统包含工程化和/或突变的Cas蛋白。在另一个实施方案中,CRISPR-Cas系统包含工程化和/或编程的指导RNA。
技术人员会理解,术语“指导RNA”包括含有与靶DNA序列区域互补或基本上互补的序列的RNA。指导RNA可含有除与靶DNA序列的区域互补或基本上互补的区域之外的核苷酸序列,例如预选的内源靶位点。在另一个实施方案中,指导RNA包含crRNA或其衍生物。在另一个实施方案中,指导RNA包含crRNA:tracrRNA嵌合体。
在另一个实施方案中,gRNA分子包含与至少一个同源染色体上的预选内源靶位点互补并结合的结构域。在另一个实施方案中,gRNA分子包含与至少一个同源染色体上的多态性等位基因互补并结合的结构域。在另一个实施方案中,gRNA分子包含与两条同源染色体上的预选内源靶位点互补并结合的结构域。在另一个实施方案中,gRNA分子包含与两条同源染色体上的多态性等位基因互补并结合的结构域。
Cas酶包含能够在DNA中产生双链断裂(DSB)的RNA引导的DNA核酸内切酶。术语“Cas酶”可与具有所有相同品质和含义的术语“CRISPR相关核酸内切酶”或“CRISPR相关多肽”互换使用。在一个实施方案中,Cas酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、C2c1、CasX、NgAgo、Csf1、Csf2、Csf3和Csf4,或其同源物,或其修饰形式。在另一个实施方案中,Cas酶包含Cas9。在另一个实施方案中,Cas酶包含CasI。在另一个实施方案中,Cas酶包含CaslB。在另一个实施方案中,Cas酶包含Cas2。在另一个实施方案中,Cas酶包含Cas3。在另一个实施方案中,Cas酶包含Cas4。在另一个实施方案中,Cas酶包含Cas5。在另一个实施方案中,Cas酶包含Cas6。在另一个实施方案中,Cas酶包含Cas7。在另一个实施方案中,Cas酶包含Cas8。在另一个实施方案中,Cas酶包含Cas10。在另一个实施方案中,Cas酶包含Cpf1。在另一个实施方案中,Cas酶包含Cyl基。在另一个实施方案中,Cas酶包含Csy2。在另一个实施方案中,Cas酶包含Csy3。在另一个实施方案中,Cas酶包含CseI。在另一个实施方案中,Cas酶包含Cse2。在另一个实施方案中,Cas酶包含Cscl。在另一个实施方案中,Cas酶包含Csc2。在另一个实施方案中,Cas酶包含Csa5。在另一个实施方案中,Cas酶包含Csn2。在另一个实施方案中,Cas酶包含Csm2。在另一个实施方案中,Cas酶包含Csm3。在另一个实施方案中,Cas酶包含Csm4。在另一个实施方案中,Cas酶包含Csm5。在另一个实施方案中,Cas酶包含Csm6。在另一个实施方案中,Cas酶包含Cmr1。在另一个实施方案中,Cas酶包含Cmr3。在另一个实施方案中,Cas酶包含Cmr4。在另一个实施方案中,Cas酶包含Cmr5。在另一个实施方案中,Cas酶包含Cmr6。在另一个实施方案中,Cas酶包含Csbl。在另一个实施方案中,Cas酶包含Csb2。在另一个实施方案中,Cas酶包含Csb3。在另一个实施方案中,Cas酶包含Csx17。在另一个实施方案中,Cas酶包含Csx14。在另一个实施方案中,Cas酶包含Csx10。在另一个实施方案中,Cas酶包含Csx16,CsaX。在另一个实施方案中,Cas酶包含Csx3。在另一个实施方案中,Cas酶包含Csx1,Csx15,Csf1。在另一个实施方案中,Cas酶包含Csf2。在另一个实施方案中,Cas酶包含Csf3。在另一个实施方案中,Cas酶包含Csf4。在另一个实施方案中,Cas酶包含Cpf1。在另一个实施方案中,Cas酶包含C2cl。在另一个实施方案中,Cas酶包含CasX。在另一个实施方案中,Cas酶包含NgAgo。在另一个实施方案中,Cas酶是Cas同系物。在另一个实施方案中,Cas酶是Cas直系同源物。在另一个实施方案中,Cas酶是修饰的Cas酶。在另一个实施方案中,Cas酶是本领域已知的任何CRISPR相关内切核酸酶。
在一个实施方案中,转化体细胞植物细胞以表达核酸酶系统或其组分。在另一个实施方案中,转化体细胞植物细胞的至少一个亲本细胞以表达核酸酶系统或其组分。在另一个实施方案中,转化体细胞植物细胞的一个亲本以表达核酸酶系统或其组分。在另一个实施方案中,转化体细胞植物细胞的每个亲本以表达核酸酶系统的组分。在另一个实施方案中,转化一个亲本以表达核酸酶系统的两个组分。
在一些实施方案中,在同源重组事件后,后代细胞,组织和/或植物不再含有核酸酶系统的靶标。(例如,参见图6A,其中不存在额外的DSB,因为预选的内源靶位点不长。DNA的测序表明没有额外的DSB事件。在一些实施方案中,在内源靶位点处由DSB诱导的同源重组后,内源靶位点的序列已被HR改变。在一些实施方案中,在由DSB诱导的同源重组后,核酸酶系统缺乏功能性。在一些实施方案中,在由DSB诱导的同源重组后,核酸酶系统缺乏将核酸酶活性靶向内源靶位点的能力。
在另一个实施方案中,体细胞植物细胞包含在杂交植物内或杂合植物内,其中所述细胞包含多态性等位基因。在另一个实施方案中,体细胞植物细胞包含:在预选内源靶位点具有多态性等位基因的现有杂合或杂合植物细胞。在另一个实施方案中,转化包含多态性等位基因的体细胞植物细胞以表达核酸酶系统。
在一个实施方案中,用编码核酸酶系统或其组分的DNA转化体细胞。在另一个实施方案中,用编码核酸酶系统或其组分的DNA转化植物的分离组织。在另一个实施方案中,用编码核酸酶系统或其组分的DNA转化亲本细胞。在另一个实施方案中,用编码核酸酶系统或其组分的DNA转化两种亲本细胞。
在一个实施方案中,用编码核酸酶系统或其组分的RNA转化体细胞。在另一个实施方案中,用编码核酸酶系统或其组分的RNA转化植物的分离组织。在另一个实施方案中,用编码核酸酶系统或其组分的RNA转化亲本细胞。在另一个实施方案中,用编码核酸酶系统或其组分的RNA转化两种亲本细胞。
在一个实施方案中,用包含核酸酶系统或其组分的多肽转化体细胞。在另一个实施方案中,用包含核酸酶系统或其组分的多肽转化植物的分离组织。在另一个实施方案中,用包含核酸酶系统或其组分的多肽转化亲本细胞。在另一个实施方案中,用包含核酸酶系统或其组分的多肽转化两种亲本细胞。
在一些实施方案中,植物细胞或分离的植物组织的转化是通过本领域已知的任何方法。在另一个实施方案中,转化导致瞬时表达。在另一个实施方案中,转化导致稳定表达。在另一个实施方案中,通过土壤杆菌的方法进行稳定转化。在另一实施方案中,转化包括直接转化。在另一个实施方案中,直接转化包括使用聚乙二醇(PEG)。在另一个实施方案中,直接转化包括通过轰击使用电穿孔。
在一些实施方案中,可以通过遗传分离从植物基因组中消除引入植物细胞的DNA,例如编码核酸酶系统的DNA。或者,在一些实施方案中,DNA瞬时表达,因此不保留在植物细胞中。
图3框a说明了转化可以是两个亲本,其中例如,它们中的每一个用核酸酶的一种组分转化,例如CRISPR/Cas核酸酶,其在杂交时变得有活性。两种核酸酶组分都可以在一种亲本中引入(图3方框b)。在图3框b中所示的实施方案中,核酸酶应该是“沉默的”并且在杂交体中被激活(使用诱导型系统)。在图3方框b中所示的另一个实施方案中,核酸酶系统可以靶向第二亲本的等位基因,而它不切割转化的亲本植物细胞的等位基因,因此它在杂交中以等位基因特异性方式变得活跃。。在另一个实施方案中,可以在具有所有核酸酶组分的现有杂交或杂合子植物(图3框c)上进行转化。
在一些实施方案中,核酸酶系统的活性或活化是可诱导的。在另一个实施方案中,诱导型核酸酶系统可以利用诱导型启动子。在另一个实施方案中,诱导型启动子可以是组织特异性的。在另一个实施方案中,可以在对植物细胞或组织有压力的条件下诱导(开启)诱导型启动子。在一些实施方案中,核酸酶系统的活性或活化是组成型的。在另一个实施方案中,活性或活化可以是组织特异性的。在另一个实施方案中,调节核酸酶系统或其部分的表达。在另一个实施方案中,组成型启动子用于表达本文公开的核酸酶系统的所有组分。在另一个实施方案中,本领域已知的任何可调节的植物启动子用于表达本文公开的核酸酶系统的所有组分。在另一个实施方案中,本领域已知的任何可调节的植物启动子用于表达本文公开的核酸酶系统的至少一种组分。在另一个实施方案中,本领域已知的并且在植物细胞中有功能的任何可调节的启动子用于表达本文公开的核酸酶系统的所有组分。在另一个实施方案中,本领域已知的和在植物细胞中有功能的任何可调节启动子用于表达本文公开的核酸酶系统的至少一种组分。
在一些实施方案中,体细胞植物细胞包含来自杂交两个栽培种植物细胞或植物的后代的细胞,其中所述亲本植物细胞各自包含与所述预选内源靶位点处的所述配偶相比的多态性等位基因。在一些实施方案中,体细胞植物细胞包含来自两个多态亲本系之间杂交的植物后代的细胞,其产生杂交植物,其中所述亲本植物系各自包含所述预选内源靶位点处的多态性等位基因,并且其中仅一条亲本系包含所述核酸酶系统。在一些实施方案中,体细胞植物细胞包含来自两个多态亲本系之间杂交的植物后代的细胞,其产生杂交植物,其中所述亲本植物系各自包含所述预选内源靶位点处的多态性等位基因,并且其中每个亲本系的一部分包含核酸酶系统的组分。
本领域技术人员将理解,如本文所用,术语“后代”包括自交或交叉的后代,并且包括直接的第一代后代(例如,F1),以及后代(例如,F2,F3等),以及回交世代,例如1-3代。在一个实施方案中,后代包含源自植物的任何一代植物或植物细胞,其中已发生如本文所公开的诱导的靶向同源重组。
在另一个实施方案中,后代包含F1代。在另一个实施方案中,后代包含F2代。在另一个实施方案中,后代包含F3代。在另一个实施方案中,后代包含F4代。在另一个实施方案中,后代包含选自F1代-F4代的多代。在另一个实施方案中,后代包含第一代回交世代。在另一个实施方案中,后代包含第二代回交世代。在另一个实施方案中,后代包含第三代回交世代。在另一个实施方案中,后代包含第四代回交世代。在另一个实施方案中,后代包含选自第1代-4代回交世代的多个回交世代。
在另一个实施方案中,所述亲本体细胞植物细胞之一包含所述核酸酶系统,并且其中所述核酸酶系统的DNA裂解活性靶向存在于不包含所述核酸酶系统的另一亲本植物细胞中的多态性等位基因。在另一个实施方案中,所述亲本体细胞植物细胞之一包含Cas核酸酶,并且所述亲本体细胞植物细胞中的另一个包含gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas核酸酶切割所述DNA内的DNA。所述预选的内源性靶位点。在另一个实施方案中,所述亲本体细胞植物细胞之一包含Cas9核酸酶,并且所述亲本体细胞植物细胞中的另一个包含gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas9核酸酶切割所述DNA内的DNA。所述预选的内源性靶位点。
在另一个实施方案中,体细胞植物细胞包含来自具有野生型植物细胞的栽培种的植物细胞后代的细胞,其中所述亲本植物细胞各自包含与所述预选的内源靶位点处的所述配偶相比的多态性等位基因。,并且其中来自栽培种的所述植物细胞包含所述核酸酶系统。在另一个实施方案中,其中体细胞植物细胞包含来自与来自具有野生型植物细胞的栽培种的植物细胞的后代的细胞,所述核酸酶系统的DNA裂解活性仅发生在野生型中存在的多态性等位基因上。亲本植物细胞。在另一个实施方案中,核酸酶系统包含ZFN,并且其中所述核酸酶系统的DNA切割活性仅发生在野生型亲本植物细胞中存在的多态性等位基因上。在另一个实施方案中,核酸酶系统包含TALEN,其中所述核酸酶系统的DNA切割活性仅发生在野生型亲本植物细胞中存在的多态性等位基因上。
在另一个实施方案中,通过本领域已知的任何方法产生具有多态性等位基因的体细胞植物细胞。在另一个实施方案中,具有多态性等位基因的体细胞植物细胞是从栽培种获得的植物细胞。
图3-步骤2:DNA双链断裂(DSB)的诱导,表示为黄色闪电。在一些实施方案中,DSB发生在所述多态性等位基因的一个等位基因中。在一些实施方案中,在二倍体的情况下,DSB出现在所述多态性等位基因的两个等位基因中。在一些实施方案中,在二倍体或具有更高倍性的细胞(例如三倍体)的情况下,DSB仅在所述多态性等位基因的一个等位基因中发生。在一些实施方案中,在二倍体或具有较高倍性的细胞(例如三倍体)的情况下,DSB出现在所述多态性等位基因的两个等位基因中。在一些实施方案中,DSB发生在所述多态性等位基因的每个等位基因中,例如两个DSB是二倍体,三个DSB是三倍体等。
虽然下面提供的实施例和图1,使用CRISPR/Cas系统说明了DSB切割,但是本领域技术人员将理解这些实施例不是限制性的,并且可以使用任何其他位点特异性核酸酶,例如ZFN或TALEN。在另一个实施例中,DSB的诱导是使用ZFN系统。在另一个实施方案中,DSB的诱导是使用TALEN系统。在另一个实施方案中,DSB的诱导是用CRISPR/Cas系统进行的。在另一个实施方案中,DSB的诱导是使用任何核酸酶系统,其可以靶向预选的内源靶位点并且可以在DNA中产生DSB。
在一些实施方案中,可以在任何植物组织或细胞和细胞周期的任何阶段诱导DSB。例如,在一个实施方案中,组成型启动子可用于激活核酸酶,使得DSB诱导可以早在杂交的受精卵中发生。在另一个实施方案中,DSB发生在体细胞组织的植物发育的早期部分。在另一个实施方案中,DSB发生在体细胞组织发育的晚期。在另一个实施方案中,DSB发生在体细胞组织发育的早期和晚期之间。
在另一个实施方案中,在单组分核酸酶系统(例如ZFN或TALEN)的情况下,通过DNA或RNA载体或通过纯化的蛋白质和gRNA的复合物或通过纯化的蛋白质转化原生质体。
在一个实施方案中,诱导包括组成型诱导。在另一个实施方案中,诱导包括非组成型诱导。在另一个实施方案中,诱导包括组织特异性诱导。在另一个实施方案中,诱导包括条件特异性诱导。在另一个实施方案中,诱导包括细胞周期依赖性诱导。在另一个实施方案中,诱导包括组成型诱导、非组成型诱导、组织特异性诱导或细胞周期特异性诱导,或其任何组合。
图3-步骤3在细胞内,诱导的DSB可以通过非同源末端连接(图1)或通过同源染色体之间的同源重组(HR)修复(内源修复模板图1,图2和图3)。在一些实施方案中,通过非同源末端连接(NHEJ)修复DSB。在其他实施方案中,通过同源重组(HR)修复DSB。出乎意料的是,如下文实施例中所示,在不存在DSB诱导的情况下,使用如本文所公开的同源染色体之间的靶向重组方法导致HR修复的频率显著高于预期天然存在的频率。
在一个实施方案中,DSB修复的结果包括基因转换(也称为非交换)。在另一个实施方案中,DSB修复的结果包括交叉。DSB修复HR产品可通过不同分析鉴定,例如通过遗传标记,SNP模式的变化,DNA测序方法,杂合性缺失(LOH)表型,或通过表型,或通过任何其他标记,或通过它们的组合。
为了确定和选择其中已发生HR的植物细胞,可以分析所述细胞的后代。在一个实施方案中,分析可包括子代细胞的分析。在另一个实施方案中,分析包括分析从所述体细胞或后代植物或其植物组织产生的植物细胞。在另一个实施方案中,分析包括分析从所述体细胞或后代植物或其植物组织产生的植物组织。在另一个实施方案中,分析包括分析植物组织。在另一个实施方案中,分析包括分析所述体细胞或其组织或细胞的植物后代。可以筛选任何类型的细胞,这取决于植物系统和所需的应用。例如,在有性繁殖的植物中,可以筛选种子,谷物,果实甚至花粉粒以鉴定已经遗传给下一代的HR修复的等位基因。在树木或营养繁殖植物中,可以筛选原生质体、愈伤组织、叶子,茎等,然后再生。在一些实施方案中,分析所述植物包括分析所述植物或其后代的一部分,所述植物或其后代包含叶、茎、芽、果实、种子或花粉,或其任何组合。因此,该方法适用于任何植物物种。
在一些实施方案中,体细胞植物细胞包含在植物组织或植物中。本领域技术人员将理解,术语“植物”包括任何种类的木本、草本、多年生或一年生植物。在一个实施方案中,本文公开的体细胞植物细胞来自包含任何种类的木本、草本、多年生或一年生植物的植物。术语“植物”还可以包括多个植物细胞,其大部分分化成存在于能够产生作物的植物发育阶段的结构。
在一个实施方案中,本文公开的体细胞来自作物植物。在一些实施方案中,体细胞植物细胞包含作物植物细胞。本领域技术人员将理解,术语“作物植物”包括具有至少一个具有商业价值的部分的植物。在一个实施方案中,作物植物包括产生可食用水果(包括蔬菜)的植物,产生谷物的植物(作为食物、饲料和用于产油),产生花和观赏植物的植物、豆科植物、块根作物、块茎作物或绿叶作物等等。
在一个实施方案中,植物包括苜蓿、苹果、杏、拟南芥、朝鲜蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯。、蓖麻、花椰菜、芹菜、樱桃、菊苣、香菜、柑橘、Clementines、三叶草、椰子、咖啡、玉米、棉花、蔓越莓、黄瓜、花旗松、茄子、菊苣、莴苣、桉树、茴香、无花果、大蒜、葫芦、葡萄、葡萄柚、蜜露、豆薯、猕猴桃、生菜、韭菜、柠檬、石灰、火炬松、亚麻籽、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕、油菜、秋葵、橄榄、洋葱、橙色、观赏植物、棕榈、木瓜、欧芹、欧洲防风草、豌豆、桃、花生、梨、胡椒、柿子、松、菠萝、车前草、李子、石榴、杨树、土豆、南瓜、木瓜、辐射松、菊苣、萝卜、油菜、覆盆子、大米、黑麦、高粱、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、枫香、柳枝稷、橘子、茶、烟草、番茄、小黑麦、草皮、萝卜、葡萄、西瓜、小麦、山药和西葫芦。
在一些实施方案中,体细胞植物细胞的同源染色体之间的靶向重组方法包括用于精确育种作物的方法。在一些实施方案中,使用同源染色体之间的靶向重组制备包含含有靶向HR事件(例如,基因转换或交换事件)的DNA的体细胞植物细胞的方法包括用于精确育种作物的方法。本文公开的方法可以精确地引入先前未呈现的体细胞植物细胞、其组织、植物或其后代的品质和/或性状。这些特性存在于例如所述体细胞的一个亲本细胞中。例如,使用本文公开的方法,农民或植物育种者可以产生更强壮的植物或抗自然危害的植物,例如害虫、病原体、干旱或贫瘠的土壤条件,或其任何组合。在其他实施方案中,本文公开的方法可以生产作物,例如具有增加的营养特性,或增加对害虫或病原体的抗性的水果或蔬菜,或者随着时间的推移更稳定以改善从一个地方运输到另一个地方的农产品的质量。在一些实施方案中,所需的品质或性状存在于植物的野生型群体中。在一些实施方案中,存在期望的品质或性状是植物的栽培种群。在一些实施方案中,期望的品质或性状存在于植物的野生型物种中,但不存在相应的栽培种。在一些实施方案中,期望的品质或性状存在于植物物种的一个栽培种中,但不存在相应的栽培种。
在一些实施方案中,包含含有所述HR事件的DNA的植物细胞,或包含所述细胞的植物组织,所述植物组织包含含有所述HR事件的DNA,或包含所述细胞的植物或其后代植物,所述植物包含含有所述HR事件的DNA或衍生的果实。来自包含所述细胞或其后代植物的植物,其包含含有所述HR事件的DNA,或来自包含所述细胞的植物或其后代植物的种子,所述植物包含含有所述HR事件的DNA或其任何组合,具有增加的抗旱性,增加的抗虫性与对照植物细胞,植物或其后代相比,对病原体的抗性增加,营养物含量改善,生长参数改善或其任何组合。在一个实施方案中,对照植物细胞,植物或其后代是其亲本细胞,植物或后代。在另一个实施方案中,对照植物细胞,植物或其子代是体细胞,植物或其后代,其中所述DSB不发生或不发生。
在一些实施方案中,本文公开的方法中靶向的预选内源靶位点包含含有基因座、基因座的一部分、基因、基因的一部分、基因的调节上游序列、基因的调节下游序列的DNA、基因的上游序列、基因的下游序列或其任何组合,并且与对照植物细胞或其后代,植物组织,植物或其后代相比较,其中所述基因的表达或缺乏影响生长、抗旱性、对害虫的抗性、对病原体的抗性或营养物含量、或任何组合所述植物细胞包含含有靶向HR事件的DNA或其后代。
在一些实施方案中,步骤(e)的选定后代选自包括F1、F2、F3、F4、回交第1代、回交第2代、回交第3代和回交第4代。
在一些实施方案中,本文公开的方法产生包含靶向HR事件的DNA的体细胞植物细胞,或包含所述细胞的植物组织,所述植物组织包含含有靶向HR事件的DNA,或包含所述细胞的植物,所述细胞包含含有靶向HR事件的DNA或包含靶向HR事件的DNA的后代植物,或包含所述细胞的植物的果实,所述植物包含含有包含靶向HR事件的DNA的所述细胞或包含靶向HR事件的DNA的子代植物,或源自包含所述细胞的植物的种子包含靶向HR事件或其后代植物的DNA,其包含含有靶向HR事件或其任何组合的DNA,其中所述细胞,组织,植物或其子代具有与对照相比增加的抗旱性、增加的对害虫的抗性、对病原体的抗性增加、改善的营养含量、改善的生长参数或其任何组合植物细胞、植物组织、其植物或其后代、果实或种子。
实施例
材料和方法–针对实施例1-4
植物材料
所有番茄植物都在温室条件下生长,温度范围在18至25℃之间。黄色果肉e3756、双色cc383、M82和醋栗番茄LA1578的番茄(S.lycopersicum)突变系由耶路撒冷希伯来大学的Joseph Hirschberg教授和Daniel Zamir教授的实验室友情提供(Kachanovsky,D.E.,Filler,S.,Isaacson,T.&Hirschberg,J.Epistasis in tomato color mutationsinvolves regulation of phytoene synthase 1expression by cis-carotenoids.Proc.Natl.Acad.Sci.U.S.A.109,19021–6(2012))。
质粒和植物转化
35s:Cas9和u6-26:sgRNA构建体先前通过Ross A.Johnson(Johnson,R.A.,Gurevich,V.,Filler,S.,Samach,A.&Levy,A.A.Comparative assessments of CRISPR-Cas nucleases’cleavage efficiency in planta.Plant Mol.Biol.87,143–56(2015))克隆。用于构建ps#1sgRNA ps#2f靶标的引物在Johnson等人(2015)(同上)中详述并在此处表1中列出。
表1:sgRNA靶标的引物
编码实施例中使用的sgRNA的DNA序列列于表2中。
表2:
根据McCormick(McCormick,S.in Plant Tissue Culture Manual 311–319(Springer Netherlands,1991).doi:10.1007/978-94-009-0103-2_17),通过具有子叶转化的根癌农杆菌GV3101转化所有番茄品系。
用于同源重组(HR)检测的反向PCR
使用DNA纯化试剂盒(MACHEREY-)提取用于反向PCR测定的DNA样品。对于每种植物,分别处理来自叶子样品或对照质粒的300ng DNA:首先,将它们与10xFD缓冲液、ApaLI(ThermoFisher scientific)和HindIII-HF(New England)一起温育过夜。在80℃灭活20分钟后,将150ng消化的片段用T4DNA聚合酶(New England)在室温下平端2小时。将T4DNA聚合酶在75℃下灭活10分钟,并将线性DNA用Quick T4DNA连接酶(New England)在室温下自连接30分钟。用DDW将对照质粒以1:10,000稀释并混合在一起以模拟“杂合性”。然后用Phusion高保真DNA聚合酶(New England)通过18个PCR循环扩增所有样品(对于引物,参见表3)。
表3:用于反向PCR同源重组检测的引物
设计用于该测定的引物用于等位基因特异性扩增。合并样品并通过高通量测序测序。
为了克隆合成的交叉-对照质粒,使用高保真DNA聚合酶(New England)从黄色果肉3756和双色cc383DNA样品中扩增出两个PCR片段(用于引物序列参见表4),然后使用GoldenBraid克隆系统(Sarrion-Perdigones,A等,GoldenBraid:AnIterative Cloning System for Standardized Assembly of Reusable GeneticModules.PLoS One 6,e21622(2011))进行克隆。
表4:合成交叉-对照质粒的引物
首先,将四个扩增子中的每一个克隆到pUPD质粒中。然后将具有来自黄色果肉e3756的“ps”片段的pUPD2质粒用含有来自双色cc383的“yl”片段的pUPD2质粒克隆到pDGB3_αl质粒中。平行地,将具有来自双色cc383的“ps”片段的pUPD2质粒用具有来自黄色果肉e3756的“yl”片段的pUPD2质粒克隆到pDGB3_αl质粒中。将这两个“合成等位基因”质粒合并在一起,并进行反向PCR过程和测序。这些“合成等位基因”质粒的DNA序列示于表5中。
表5:合成交叉对照的质粒
DNA扩增和测序
使用High-Fidelity DNA聚合酶(New England)和18个PCR循环(对于每个实验的特异性引物,参见表6)扩增用于高通量测序的DNA样品。
表6:高通量测序的引物
*n代表A、T、C或G。
如Blecher-Gonen等(Blecher-Gonen,R.等,High-throughput chromatinimmunoprecipitation for genome-wide mapping of in vivo protein-DNAinteractions and epigenomic states.Nat.Protoc.8,(2013))所述制备文库。高通量测序在Weizmann Institute of Science的G-INCPM单元进行,且Illumina HiSeq 2500平台用于2x125配对末端读数。
使用RED(SIGMA-ALDRICH)以35个PCR循环扩增用于Sanger测序的DNA样品(对于引物,参见表7)。
表7:Sanger测序的引物
PCR后,用外切核酸酶I和虾碱性磷酸酶(rSAP)(New England)“清洗”DNA。测序在Weizmann Institute of Science的Biological服务单元用Applied Biosystems3730DNA Analyzer进行。
实施例1:用于分析DNA双链断裂(DSB)修复的番茄果实颜色测定
目的:估计体内非同源末端连接(NHEJ)与基于同源重组(HR)的内源植物基因座双链断裂(DSB)修复的比率。
方法:为了估计在内源植物基因座上体细胞NHEJ与基于HR的DSB修复的比率,设计了果实颜色测定法。使用两个番茄突变体系,每个突变体在八氢番茄红素合成酶1(Phytoene synthase1,PSY1)基因中具有不同的突变。黄色果肉e3756等位基因是EMS突变体,其在PSY1中具有过早终止密码子,导致黄色果实表型(Kachanovsky,D.E.,Filler,S.,Isaacson,T.&Hirschberg,J.Epistasis in tomato color mutations involvesregulation of phytoene synthase 1expression by cis-carotenoids.Proc.Natl.Acad.Sci.U.S.A.109,19021–6(2012))。双色cc383等位基因是在PSY1的启动子中具有3.7Kb缺失的突变体,导致黄红色脱毛果实表型(图4A)。
为了监测整个植物发育过程中CRISPR-Cas诱导的突变,从受精开始,产生表达35S:Cas9(SEQ ID NO:59)的转基因黄色果肉e3756和表达PSY1单指导RNA(u6-26:Ps#1-sgRNA;质粒序列为SEQ ID NO:60;PS#1-sgRNA为SEQ ID NO:68)的转基因双色cc383系。设计该u6-26:Ps#1-sgRNA以在两个等位基因上诱导双色cc383和黄色果肉e3756突变之间的DNADSB(图4A)。黄色果肉e3756:35S:Cas9和双色cc383u6-26:Ps#1-sgRNA之间的杂交预期产生具有显性双色cc383果实表型的F1植物。对于不表达35S:Cas9或u6-26:Ps#1-sgRNA的对照植物,预期相同。由于在一个或两个等位基因上诱导DSB,随后易于错误的DNA修复,预期在表达Cas9和Ps#1-sgRNA的植物中与该表型的偏差。双色cc383等位基因的NHEJ修复应产生黄色果实表型(部分或整个果实)。基于HR的机制(交叉或非交叉事件)修复DSB的结果,如果在发育早期发生HR事件应该是红色果实,或者如果在发育晚期发生HR事件应该是具有红色斑点或部分的黄色果实(图4A)。
结果:在DSB诱导后,50个黄色果肉e375635S:Cas9x双色cc383u6-26:Ps#1-sgRNA F1植物的群体产生双色、黄色以及具有红色斑点的黄色的果实。当使用不同的黄色果肉e375635S:Cas9转基因系时,果实表型的分布变化(图4B)。如所预期的,在没有DSB诱导的情况下,6个黄色果肉e375635S:Cas9x双色cc383F1植物的对照群体仅显示双色果实(图4B)。果实颜色测定的一个优点是它能够预测下一代修复产品的遗传。实际上,预计从完全黄色的果实中提取的F2种子将产生发芽突变。
为了证实黄色果实指示NHEJ生发事件,生长来自黄色果实的F2植物。使用黄色果肉e3756和双色cc383等位基因的等位基因特异性PCR扩增和PCR产物的测序,显示在所有测试的情况下,来自黄色果实的种子在双色cc383等位基因的DSB位点(表9)处产生携带发芽突变的种子。表8列出了所用的PCR引物。
表8:NHEJ生发事件的引物
表9:NHEJ生发事件
通过Sanger测序对表9的来自F1的黄色果肉e375635S:Cas9x双色cc383u6-26:Ps#1-sgRNAPs#1-sgRNA的F2植物的等位基因特异性PCR产物进行测序。所有植物在双色等位基因处具有插入缺失(插入和/或缺失)。13个中有4个在黄色果肉等位基因中也有插入缺失。
来自黄色果实的一些后代也在黄色果肉e3756等位基因中显示突变(表9)。尽管发现许多具有小红色部分的黄色水果(图4B),但在F1植物中未检测到完全红色的果实。此外,种植了来自具有红色斑点的果实的F2植物400株,提示体细胞同源重组(HR),但没有检测到完全红色果实,这表明发芽的HR事件。
实施例2:通过体细胞非同源末端连接(NHEJ)和同源重组(HR)的高速率CRISPR-Cas9DNA DSB诱导导致修复
目的:识别、表征和量化F1中的体细胞NHEJ事件。
方法:为了鉴定、表征和量化F1中的体细胞NHEJ事件,使用了22株黄色果肉e375635S:Cas9x双色cc383u6-26:Ps#1-sgRNAPs#1-sgRNA群体,以及将黄色果肉e3756x双色cc383的2株植物用作对照。使用来自植物的不同分支的四(4)片叶子。然后,提取它们的DNA,通过PCR扩增两个等位基因的诱导DSB侧翼的区域,并使用高通量测序Illumina HiSeq 2500平台对所得产物进行测序。
为了测量HR修复,设计了一种反向PCR方法,该方法允许对相距1.7Kb的两个等位基因特异性突变进行测序(黄色果肉e3756和双色cc383),使得能够区分亲本和重组分子(图4D)并最小化假阳性PCR产物的形成。用于体细胞NHEJ测序的相同DNA样品(图4C)用于反向PCR。另外,克隆了两个合成阳性对照(重组样克隆),其也通过相同的反向PCR方法处理。通过Illumina HiSeq 2500配对末端测序对来自每个反应的反向PCR产物(如图4D中所示)进行测序。
结果:在每株植物250,000-850,000个读数(PCR样品)中,平均88%的黄色果肉e375635S:Cas9x双色cc383u6-26:Ps#1-sgRNAPs#1-sgRNA植物的读数包含在CRISPR DSB位点处的突变,而只有2%的黄色果肉e3756x双色cc383植物的读数偏离WT序列,可能是由于PCR和测序错误(图4C)。由于不同的NHEJ修复事件,系统中CRISPR-Cas DSB诱导的高速率导致广谱突变。此外,发现一些NHEJ标记,例如4bp CTTG缺失,优于该基因座处的其他标记(图4C,图5)。
在测量HR修复的测定中,每株植物获得5,000-50,000个读数。黄色果肉e3756x双色cc383的阴性对照仅在没有DSB诱导的情况下显示亲本等位基因,而阳性合成对照显示重组等位基因(图4E)。黄色果肉e375635S:Cas9x双色cc383u6-26:Ps#1-sgRNAPs#1-sgRNA的大多数F1植物仅显示亲本等位基因,但其中一些显示重组等位基因之一,表明基于体细胞HR的修复。
实施例3:等位基因特异性DSB诱导和修复产物的高分辨率分析
目的:创建一种区分破损染色体和修复模板的方法。
黄色果肉e3756x双色cc383之间的上述交叉不能提供足够的SNP来详细分析HR修复产物。此外,它不能进行等位基因特异性断裂,这是进行精确实验所必需的,其中可以区分断裂的染色体和修复模板。
方法:因此,设计了一种新的DSB修复试验,通过使用醋栗番茄LA1578,一种带有小红色果实的野生番茄种质和一个测序的基因组显示与可食用番茄(Solanum lycopersicum)相比,在断裂位点和远端区域提供了多个SNP的存在和位置。为了确保等位基因特异性断裂,在可食用番茄M82栽培品种背景中制备了等位基因,其对u6-26:Ps#2-sgRNA免疫。为此目的,红色水果cv.M82用35S:Cas9转化(质粒序列是SEQ ID NO:59;编码Cas9的序列是SEQID NO:65)和u6-26:Ps#2-sgRNA(质粒序列是SEQ ID NO:60;编码sgRNA序列是SEQ ID NO:68)。然后,选择T0中的黄色果实并且从它的T1群体生长它们的T1种子,在CRISPR-Cas9DSB位点用腺嘌呤插入(+A)分离纯合子植物,其与野生番茄种质杂交。
用于等位基因特异性DSB诱导和等位基因依赖性修复的gRNA分子的序列在SEQ IDNO:61中列出。
在该测定中,醋栗番茄LA1578是DNA DSB的唯一靶标,因为+A插入,在M82psyl等位基因中破坏原型间隔区相邻基序(PAM)并阻止Cas9切割。M82等位基因的+A突变是隐性的,因此预期F1植物具有小的红色果实。由NHEJ或HR(交叉或非交叉)在PSY1中进行的DSB修复导致黄色果实或具有黄色部分的红色果实,这取决于修复发生时的发育果实阶段。预计NHEJ修复事件会在DSB位点留下小插入缺失,而交叉和非交换事件可通过DNA DSB两侧SNP模式的差异来识别(图6A)。
对于体细胞DSB修复的分析,来自双亲的叶子(M82 35S:Cas9,U6-26:gRNA,+A纯合子和醋栗番茄LA1578)和来自五种F1植物的DSB DNA区域被PCR扩增。并通过Illumina HiSeq2500配对末端测序进行测序(图7)。该测序产量为每株600,000-900,000个读数。
此处显示M82psy1+A等位基因对DSB诱导免疫,在M82(M82 35S:Cas9和u6-26:Ps#2-sgRNA,+A纯合子)亲本中几乎没有DSB足迹,支持设计的等位基因特异性gRNA(图7)。此外,至少50%的读数给出+A插入,而醋栗番茄等位基因突变(图7的饼图中的红色)。发现只有7-18%的F1植物读数是WT,其余的给出了各种插入缺失模式(图7)。为了估计生发事件的比率,不同分支上的果实颜色是文件,并且用Illumina对果实果皮组织进行测序(图8)。
通过该测定,完全黄色的果实可能含有通过NHEJ或HR进行修复的生发事件的种子(图6A)。此外,交叉或非交换事件应给出+A,+A纯合子植物,因为模板修复是M82psy1+A等位基因(图9A)。在一种F1植物中,发现黄色果实显示出高+A,通过Illumina和Sanger测序得到+A含量(图10)。通过Sanger方法培养这些植物的F2后代并测序。测序揭示F2植物具有对应于生发HR事件的SNP模式(图6B)。植物#2和#7看起来像非交叉的清晰情况,两者都具有至少5Kb的转换轨迹。植物#11看起来像一个交叉的情况(图6B),然而,由于植物,对植物#11中DSB位点两侧超过20kb的侧翼标记(Indels和SNP)的分析无法进行因此死亡,所以这个案子被称为假定的交叉。
为了鉴定纯合子基因转换产物,并更好地表征转化轨迹的边界,对来自植物F2#7后代的F3植物进行测序。F2#7s的F3后代之一(显示于图6B的底部)是基因转换修复的纯合子产物,具有5-6kb长度的确认转化轨迹。
实施例4:等位基因依赖性修复速率的定量
目的:测试等位基因依赖性修复。由于以上在等位基因特异性DSB诱导的实施例3中开发的系统(其是HR的标志),能够测试等位基因依赖性修复。在醋栗番茄LA1578等位基因上的DNA DSB的诱导显示在许多水果和叶子的破碎位点处类似于M82psy1+A等位基因的+A标记(图7和8)。这种过量的+A修复可能是由于优选的NHEJ修复模式或由HR介导的等位基因依赖性修复。
方法:为了区分这两种可能性,培育了M82品种的几种植物,它们都是相同35S:Cas9 u6-26:Ps#2-sgRNA的后代。在该群体中,22种植物最初是PSY1的M82WT等位基因的纯合子,而14种植物最初是杂合子M82-WT PSY1/M82psy1+A。使植物生长至4周龄,从它们各自收集4片叶子。然后,通过PCR扩增DSB周围的DNA,并用Illumina HiSeq 2500平台对PCR产物进行测序。对于每种植物,计算每个插入物中读数总数的百分比。如果+A突变在每个染色体中独立发生,则WT中具有新的+A突变(其具有两个潜在靶标)的读数应该是仅有一个靶标可用的杂合子中的两倍(图9A)。
为了测量预期的等位基因非依赖性+A NHEJ足迹,使用WT纯合子的22株植物并计算+A读数除以2的百分比以获得每个等位基因出现+A突变的值。使用以下等式:预期=(%(+A reads)T=4周(wt,wt))/2。当第二个等位基因含有+A突变(在M82-WT PSY1/M82psy1+A杂合子植物中)时,通过取M82-WT PSY1/M82psy1+A植物中+A读数的%来计算在WT等位基因中出现新的+A突变,并推断为50%(来自M82psy1+A等位基因的读数的初始百分比)。以下等式用于在杂合子M82-WT PSY1/M82psy1+A植物中观察到的+A突变率:观测值=%(+A读数)T=4周,(wt,+A)-50%。
结果:当比较观察到的+A足迹的预期时,发现杂合子群体中新颖+A突变的比率显著高于预期(p=0.009)。考虑到两个群体是同基因的,这表明DSB位点的修复依赖于其同源等位基因的序列(图9B)。a+A足迹的等位基因非依赖性频率在M82-WT中为每个等位基因4%,而M82-WT PSY1/M82psy1+A杂合子中M82-WT PSY1等位基因的+A足迹频率为18%(图9B)。这表明18-4=~14%的DSB修复事件是等位基因依赖性的(同源修复重组事件),其余的通过NHEJ以等位基因非依赖性方式发生。
实施例1-4的总结
体细胞DSB修复
早期关于体细胞DSB诱导的HR修复的研究主要通过染色体内重组或染色单体不等交换的转基因测定进行。值得注意的是,本文公开和示例的方法在内源基因组环境中进行,其中可以在同源染色体上跟踪修复模板起点。实施例1-4的结果表明,可以使用同源染色体作为模板,通过体细胞同源重组修复靶向DSB。这与使用外源模板的基因靶向显著不同。
此外,还证明了这些修复事件中的一些可以生发地传播给下一代。在一组杂交中,显示WT等位基因可以通过两个缺陷的psyl亲本等位基因(双色cc383和黄色果肉e3756)之间的基因内重组来恢复,该事件被视为红色斑点(实施例1,图4A)并通过序列分析表征(实施例2,图4C)。在这个交叉中没有恢复完全红色的果实,这将对应于早期的生发事件。这可能是由于双色等位基因中大的缺失的基因组背景,或者“固化的”重组WT等位基因在发育期间经历了第二轮NHEJ(目标位点在HR期间未被破坏),这将导致损失功能(黄色)等位基因通过NHEJ。考虑到NHEJ的高效率,这是一个看似合理的方案。此外,在醋栗番茄X可食用番茄F1杂交中的等位基因特异性DSB诱导的测定中,发现三个HR-依赖性修复的情况,其发芽传递至F2和F3代。两种情况对应于具有5-6Kb的转换轨迹的非交叉事件(示例3,图6B)。第三种情况(F2植物#11)是一种生发性HR事件,可能是交叉事件或非交叉事件-由于植物死亡而无法证明这一点。最后,尝试量化HR与NHEJ的比率,设计sgRNA用于番茄背景中的等位基因特异性DSB诱导。该实验设置使得能够测量源自同源等位基因的过量修复足迹与预期相比,表明在所有可检测的DSB修复事件中,14%是等位基因依赖性的,其余是非同源的。14%的等位基因依赖性HR修复是出乎意料的,其中令人惊讶的是,所使用的方法产生的HR显著高于预期。
体细胞与减数分裂HR
比较体细胞与减数分裂细胞中HR介导的修复是感兴趣的。总体上对于体细胞组织中的同源物重组知之甚少,这可能是由于此类事件的频率低,缺乏表型标志物以及难以检索生发事件。在没有DSB的情况下未检测到红色区段,并且基因内重组分子的存在无效或可忽略不计。这与早期的烟草研究结果一致,表明在缺乏DSB诱导的互惠和非互惠HR事件中,体细胞HR的发生率非常低。同源染色体之间的低体细胞HR率可能表明存在瓶颈,例如缺乏控制同源物配对,联会复合物形成等的减数分裂中发现的HR机制。结果显示,基于案例研究和定量评估的意外相对较高的HR修复率表明DSB是一个主要瓶颈,令人惊讶地诱导体细胞HR从0%(在没有断裂时)到-14%每个等位基因(在实施例4中测量的等位基因依赖性修复,图9B)并且在缺乏减数分裂HR机制的情况下,同源物之间的DSB诱导的HR可以发生。
此处报告的HR DSB修复率(每个等位基因约为14%)似乎高于减数分裂过程中报告的值。实际上,只有一小部分减数分裂(~3-5%)演变成交叉,类似的部分被修复为非交叉。
同样,提供了关于DSB介导的HR修复发生的证据,然而在大多数测定中,不可能区分交叉修复机制和非交叉修复机制。对多态背景中的3个生发事件的分析能够实现这种区分,但样本(2次转换和1次推定交叉)太小而无法得出结论。
与早期减数分裂报告相比的显著差异在于,与减数分裂HR事件报告的552bp的平均区域相比,此处表征的非交换体细胞事件中的转化区长度为~5Kb。这些长转换轨迹可能反映了物种(番茄与拟南芥)之间或减数分裂与体细胞之间的差异。也可能的是,Spoi11与DSB末端的结合在保护末端免于降解和减少转换轨道长度方面比Cas9更有效。最后,这是内源性同源染色体之间的靶向HR的第一份报告,而没有关于靶向减数分裂重组的早期报道。
体细胞交叉确实发生在植物中,并且甚至可以在一些突变体中达到高水平,表明同源物交叉机制可用于体细胞组织并且靶向交叉是可行的。有趣的是,尽管减数分裂交叉机器在进化过程中得到了优化,但在减数分裂期间针对特定DSB的诱导必须与数百个自然发生的其他突破竞争作为交叉的基质并与直觉相反,对于目标交叉诱导而言,效率低于体细胞HR。
利用体细胞HR进行精确育种
结果显示定制设计的核酸酶,例如CRISPR-Cas,可用于精确重组体细胞中同源染色体之间的染色体区段。例如,有可能从相对于作物的野生植物转移抗病基因,而不需要长时间的回交过程,这不仅需要几代才能获得同基因系,而且还会拖曳大部分不需要的DNA侧翼理想的基因。因此,使用本文公开的方法有利于在具有靶向HR事件(交叉或基因转换)的植物中产生定制重组,其中与未经历靶HR事件的亲本植物相比,从所产生的植物中添加或去除质量或性状。此外,与筛选天然重组事件相比,植物在缩短的时间范围内产生并且具有显著更小的种群大小,并且更精确地产生感兴趣的植物中的重组事件,而不添加不期望的DNA。在一些实施方案中,HR交换或基因转换事件引入由于基因或基因元件之间的紧密连接而不易由天然存在的HR引入的基因或调节元件。换句话说,本文描述和举例说明的方法证明体细胞HR可用于等位基因置换。
实施例5:拟南芥中常染色质和异染色质区域中体细胞组织中的靶向DSB诱导的交叉
目的:上述实施例1-4的结果,在番茄中,在体细胞DNA DSB下显示出高水平的基于HR的修复。这些结果局限于位于染色体3的亚端粒区域中的单个基因座(PSY1)的研究,其通常对应于常染色质(开放染色质)区域。此外,观察到的同源依赖性修复可能通过交叉或基因转换发生,因为实验系统无法区分这两种机制。最后,研究了单个物种中的单一基因座,不知道该现象有多普遍,以及在常染色体和异染色质(紧密包装的染色质)区域中是否会观察到体细胞组织中DSB的HR诱导效应。这里的目的是检测在另一物种的体细胞DNA DSB下以及常染色质和异染色质区域中基于HR的修复。
已知异染色质区域在DNA重组中受到抑制。在一些物种中,异染色质代表80%的基因组(例如玉米和小麦)。异染色质在着丝粒周围占主导地位,可能含有高达25%的基因。在这些区域缺乏重组是植物育种的障碍,因为有害基因不能从有益基因中分离出来。
本文描述了在几个遗传基因座上的靶向HR(交换和基因转换)的实例,包括具有对应于常染色质的染色质修饰的基因座(低胞嘧啶甲基化,低核小体占据,组蛋白3-赖氨酸4二甲基化或三甲基化(H3K4me2/3))和具有异染色特征的基因座(高胞嘧啶甲基化,高核小体占据,H3K9me2/3,H3K27me3,如本领域中已知的)。这些常染色质和异染色质区域分别对应于减数分裂热点或冷点)(Shilo等,2015“DNA Crossover Motifs Associated withEpigenetic Modifications Delineate Open Chromatin Regions in Arabidopsis”Plant Cell,Sep;27(9):2427-36)。
方法:为了测试具有常染色和异染色特征的区域中DNA DSB修复的性质,使用交叉测试系(Melamed-Bessudo等,2005“A new seed-based assay for meioticrecombination in Arabidopsis thaliana”Plant J.43(3):458-66),哥伦比亚生态型拟南芥系,GFP和RFP标记在染色体3上以5Mega bp的距离分开,在种子特异性Napine启动子下表达,产生红色和绿色荧光的种子(亲本类型)或仅红色或仅绿色(交叉重组类型)。
基于遗传基序和表观遗传学特征,选择了用于GFP和RFP标记之间的DSB诱导的12种不同靶标(表10显示在图11中);“寒冷地区”中的四个位点(具有典型的重组冷点的异色特征)和“热区域中的八个目标”(重组热点典型的常见特征)(图12A)。
首先,转化12个哥伦比亚重组测试系,其包括12个不同的靶,以表达对应于DSB靶的小指导RNA(35Sx2:潮霉素,u6-26:gRNA构建体)。此外,WT Columbia系被工程化以在体细胞组织中活化的组成型遍在蛋白启动子下表达Cas9(nos:nptII:nos Ubi:spCas9)。然后将表达12种gRNA的细胞系与表达Cas9和WT的WT哥伦比亚系杂交,使对潮霉素和卡那霉素(即含有gRNA和Cas9)均具有抗性的植物种群与哥伦比亚测试系和Landsberg生态型不含gRNA和F1的对照F1群体一起生长和收获(图12B)。在该测定中,DSB断裂已经在体细胞组织中诱导,并且在种子中测量结果。因此,将测量传递到种系的早期体细胞交叉事件。对于每种F1植物,将其300-500个F2种子计数为仅红色(重组型)、仅绿色(重组型)、红色和绿色(亲本型)和非荧光种子(亲本型)。基于这些计数,计算GFP和RFP标记之间的重组频率(以cM计)。
结果:出乎意料的是,该测试的结果(图12C)显示,对于所有计数的热和冷目标,相对于Fl Columbia Ubi的对照群体,发现相当或增加的交叉率:cas9x Columbia测试系控制。在该测定中,亲本都处于Columbia背景中,并且只有标记是多态的。
为了表征重组断裂点,将F1植物与多态性WT Landsberg生态型进行回交,使F2回交群体(潮霉素和卡那霉素抗性植物)生长,从这些植物的体细胞组织中提取DNA,并收集它们的F3种子(图12B)。使用PacBio对位于哥伦比亚测试者x Landsberg的这些回交植物的靶区域侧翼的5Kb片段进行测序,以进行DNA DSB修复事件的高分辨率表征(图13)。总之,这些结果为常染色质和异染色质修复位点上的靶向DSB诱导的重组提供了支持。
虽然本文已经说明和描述了本文公开的某些特征,但是本领域普通技术人员现在将想到许多修改、替换、改变和等同物。因此,应理解,所附权利要求旨在涵盖落入本文公开的遗传修饰的植物和方法的真正精神内的所有这些修饰和变化。
序列表
<110> 耶达研究与发展有限公司
LEVY, Avraham A.
MELAMED-BESSUDO, Cathy
FILLER-HAYUT, Shdema
<120> 同源染色体之间的靶向重组及其用途
<130> P-80701-PC
<150> 62/444,827
<151> 2017-01-11
<160> 80
<170> PatentIn 版本 3.5
<210> 1
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> Ps#1sgRNA F
<400> 1
attggaatgt ctgttgcctt gtta 24
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Ps#1 sgRNA R
<400> 2
aaactaacaa ggcaacagac att 23
<210> 3
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> Ps#2 sgRNA F
<400> 3
attggagcgt atataatgct gctt 24
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Ps#2 sgRNA R
<400> 4
aaacaagcag cattatatac gct 23
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> a 3756 bic hr f
<400> 5
tcagctatgc taatgactcc cgag 24
<210> 6
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> a bic hr r
<400> 6
agtccattct ctattccgca tagtga 26
<210> 7
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> a 3756 r
<400> 7
tgacaaccga cctaaatcga tccg 24
<210> 8
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> b bic hr r
<400> 8
actgcattct ctattccgca tagtga 26
<210> 9
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> b 3756 r
<400> 9
gactactgaa ccgacctaaa tcgatccg 28
<210> 10
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> pupd_y1_f
<400> 10
gcgccgtctc gctcgtactc gaacgagggt catc 34
<210> 11
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> pupd_y1_r
<400> 11
gcgccgtctc gctcgagcgc cataattgga acactcatca a 41
<210> 12
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> pupd_ps_f
<400> 12
gcgccgtctc gctcgggagc aaccttattt tgtactt 37
<210> 13
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> pupd_ps_r
<400> 13
gcgccgtctc gctcgagtac aacatatcaa aataggtat 39
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp f
<400> 14
ggtttgcctg tctgtggtct 20
<210> 15
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r1
<400> 15
agtcccatga aacttgtccc atttg 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r2
<400> 16
tcagccatga aacttgtccc atttg 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r3
<400> 17
actgccatga aacttgtccc atttg 25
<210> 18
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r4
<400> 18
tgacccatga aacttgtccc atttg 25
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r5
<400> 19
gactccatga aacttgtccc atttg 25
<210> 20
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> psy1 t1 htp r6
<400> 20
ctgaccatga aacttgtccc atttg 25
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> nhej_psy1_t2_r
<400> 21
gcctaaatac ggcacttcca 20
<210> 22
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> a_nhej_psy1_t2_f
<400> 22
agtcgtatcg cccctgaatc aaag 24
<210> 23
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> b_nhej_psy1_t2_f
<400> 23
tcaggtatcg cccctgaatc aaag 24
<210> 24
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> c_nhej_psy1_t2_f
<400> 24
tgacgtatcg cccctgaatc aaag 24
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> d_nhej_psy1_t2_f
<400> 25
actggtatcg cccctgaatc aaag 24
<210> 26
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> e_nhej_psy1_t2_f
<400> 26
gactgtatcg cccctgaatc aaag 24
<210> 27
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> f_nhej_psy1_t2_f
<400> 27
ctgagtatcg cccctgaatc aaag 24
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> nnn_a_nhej_psy1_t2_f
<220>
<221> misc_feature
<222> (1)..(6)
<223> n is a, c, g, or t
<400> 28
nnnnnnagtc gtatcgcccc tgaatcaaag 30
<210> 29
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> nnn_b_nhej_psy1_t2_f
<220>
<221> misc_feature
<222> (1)..(6)
<223> n is a, c, g, or t
<400> 29
nnnnnntcag gtatcgcccc tgaatcaaag 30
<210> 30
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> nnn_nhej_psy1_t2_r
<220>
<221> misc_feature
<222> (1)..(6)
<223> n is a, c, g, or t
<400> 30
nnnnnngcct aaatacggca cttcca 26
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> PSY1_1_F
<400> 31
tttgcagaag tcaagaaaca gg 22
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PSY1_t4_ident_R
<400> 32
gatgtcatcg tccgttctcc 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PSY1 psnps F
<400> 33
acggtatctt cccaccttca 20
<210> 34
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> PSY1 psnps R2
<400> 34
atagtgttaa ttgtgtaggc tcctt 25
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PSY1 psnps F2
<400> 35
cgacgaggag taaggtttgc 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PSY1 psnps R
<400> 36
tcagtccatt tcgttttcgt 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> psy1_t123_f
<400> 37
atgttgcagc cattcagaga 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> psy1_t123_r
<400> 38
tgatcatggc tcgtcactgt 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> psy1 term f
<400> 39
acaagtaccc tgggttggag 20
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> psy1_term_r2
<400> 40
gcagtttttg taggaggcac a 21
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> psy1_term_f2
<400> 41
tgtgcctcct acaaaaactg c 21
<210> 42
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> psy1 term r
<400> 42
tggattgaat cgaatttgga taa 23
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pimpixm82_co_f
<400> 43
ctttgcactt ggttactcag a 21
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> pb_psy1_r
<400> 44
agcctacggc ccaaactatt 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 14036_f
<400> 45
tgctaatggg gcaggaaata 20
<210> 46
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 14036_r
<400> 46
tcaagtaacg taaaacacgt tgaaa 25
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 5kb_up_t2_F
<400> 47
ttcatttgac gagcgatctg 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 5kb_up_t2_R
<400> 48
ttggctgctt tgaccttacc 20
<210> 49
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 40kb_down_t2_f
<400> 49
cattatccta agagtgcagt cagc 24
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 40kb_down_t2_r
<400> 50
tggtttctcg attacctctt tca 23
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 20kb_down_t2_f
<400> 51
tgacaccaat ccatccaatc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 20kb_down_t2_r
<400> 52
ctgctacctg cactggctct 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 20kb_up_t2_f
<400> 53
tacgtccccg aagaaatcac 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 20kb_up_t2_r
<400> 54
cccttaggct ccgaagttgt 20
<210> 55
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 40kb_up_t2_f
<400> 55
cacataagag gacacgttta ttca 24
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 40kb_up_t2_r
<400> 56
gccacggaga aaatagttga 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> JF_F
<400> 57
tgcaaagtgc tacgtgtcct 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PSY1_1_R
<400> 58
aatgtgaaca gcaacgcaaa 20
<210> 59
<211> 18063
<212> DNA
<213> 人工序列
<220>
<223> 35S:Cas9 质粒
<400> 59
ggggacaagt ttgtacaaaa aagcaggcta tggatccccg ggatcatcta cttctgaaga 60
ctcagactca gactaagcag gtgacgaacg tcaccaatcc caattcgatc tacatcgata 120
agaagtactc tatcggactc gatatcggaa ctaactctgt gggatgggct gtgatcaccg 180
atgagtacaa ggtgccatct aagaagttca aggttctcgg aaacaccgat aggcactcta 240
tcaagaaaaa ccttatcggt gctctcctct tcgattctgg tgaaactgct gaggctacca 300
gactcaagag aaccgctaga agaaggtaca ccagaagaaa gaacaggatc tgctacctcc 360
aagagatctt ctctaacgag atggctaaag tggatgattc attcttccac aggctcgaag 420
agtcattcct cgtggaagaa gataagaagc acgagaggca ccctatcttc ggaaacatcg 480
ttgatgaggt ggcataccac gagaagtacc ctactatcta ccacctcaga aagaagctcg 540
ttgattctac tgataaggct gatctcaggc tcatctacct cgctctcgct cacatgatca 600
agttcagagg acacttcctc atcgagggtg atctcaaccc tgataactct gatgtggata 660
agttgttcat ccagctcgtg cagacctaca accagctttt cgaagagaac cctatcaacg 720
cttcaggtgt ggatgctaag gctatcctct ctgctaggct ctctaagtca agaaggcttg 780
agaacctcat tgctcagctc cctggtgaga agaagaacgg acttttcgga aacttgatcg 840
ctctctctct cggactcacc cctaacttca agtctaactt cgatctcgct gaggatgcaa 900
agctccagct ctcaaaggat acctacgatg atgatctcga taacctcctc gctcagatcg 960
gagatcagta cgctgatttg ttcctcgctg ctaagaacct ctctgatgct atcctcctca 1020
gtgatatcct cagagtgaac accgagatca ccaaggctcc actctcagct tctatgatca 1080
agagatacga tgagcaccac caggatctca cacttctcaa ggctcttgtt agacagcagc 1140
tcccagagaa gtacaaagag attttcttcg atcagtctaa gaacggatac gctggttaca 1200
tcgatggtgg tgcatctcaa gaagagttct acaagttcat caagcctatc ctcgagaaga 1260
tggatggaac cgaggaactc ctcgtgaagc tcaatagaga ggatcttctc agaaagcaga 1320
ggaccttcga taacggatct atccctcatc agatccacct cggagagttg cacgctatcc 1380
ttagaaggca agaggatttc tacccattcc tcaaggataa cagggaaaag attgagaaga 1440
ttctcacctt cagaatccct tactacgtgg gacctctcgc tagaggaaac tcaagattcg 1500
cttggatgac cagaaagtct gaggaaacca tcaccccttg gaacttcgaa gaggtggtgg 1560
ataagggtgc tagtgctcag tctttcatcg agaggatgac caacttcgat aagaaccttc 1620
caaacgagaa ggtgctccct aagcactctt tgctctacga gtacttcacc gtgtacaacg 1680
agttgaccaa ggttaagtac gtgaccgagg gaatgaggaa gcctgctttt ttgtcaggtg 1740
agcaaaagaa ggctatcgtt gatctcttgt tcaagaccaa cagaaaggtg accgtgaagc 1800
agctcaaaga ggattacttc aagaaaatcg agtgcttcga ttcagttgag atttctggtg 1860
ttgaggatag gttcaacgca tctctcggaa cctaccacga tctcctcaag atcattaagg 1920
ataaggattt cttggataac gaggaaaacg aggatatctt ggaggatatc gttcttaccc 1980
tcaccctctt tgaagataga gagatgattg aagaaaggct caagacctac gctcatctct 2040
tcgatgataa ggtgatgaag cagttgaaga gaagaagata cactggttgg ggaaggctct 2100
caagaaagct cattaacgga atcagggata agcagtctgg aaagacaatc cttgatttcc 2160
tcaagtctga tggattcgct aacagaaact tcatgcagct catccacgat gattctctca 2220
cctttaaaga ggatatccag aaggctcagg tttcaggaca gggtgatagt ctccatgagc 2280
atatcgctaa cctcgctgga tctcctgcaa tcaagaaggg aatcctccag actgtgaagg 2340
ttgtggatga gttggtgaag gtgatgggaa ggcataagcc tgagaacatc gtgatcgaaa 2400
tggctagaga gaaccagacc actcagaagg gacagaagaa ctctagggaa aggatgaaga 2460
ggatcgagga aggtatcaaa gagcttggat ctcagatcct caaagagcac cctgttgaga 2520
acactcagct ccagaatgag aagctctacc tctactacct ccagaacgga agggatatgt 2580
atgtggatca agagttggat atcaacaggc tctctgatta cgatgttgat catatcgtgc 2640
cacagtcatt cttgaaggat gattctatcg ataacaaggt gctcaccagg tctgataaga 2700
acaggggtaa gagtgataac gtgccaagtg aagaggttgt gaagaaaatg aagaactatt 2760
ggaggcagct cctcaacgct aagctcatca ctcagagaaa gttcgataac ttgactaagg 2820
ctgagagggg aggactctct gaattggata aggcaggatt catcaagagg cagcttgtgg 2880
aaaccaggca gatcactaag cacgttgcac agatcctcga ttctaggatg aacaccaagt 2940
acgatgagaa cgataagttg atcagggaag tgaaggttat caccctcaag tcaaagctcg 3000
tgtctgattt cagaaaggat ttccaattct acaaggtgag ggaaatcaac aactaccacc 3060
acgctcacga tgcttacctt aacgctgttg ttggaaccgc tctcatcaag aagtatccta 3120
agctcgagtc agagttcgtg tacggtgatt acaaggtgta cgatgtgagg aagatgatcg 3180
ctaagtctga gcaagagatc ggaaaggcta ccgctaagta tttcttctac tctaacatca 3240
tgaatttctt caagaccgag attaccctcg ctaacggtga gatcagaaag aggccactca 3300
tcgagacaaa cggtgaaaca ggtgagatcg tgtgggataa gggaagggat ttcgctaccg 3360
ttagaaaggt gctctctatg ccacaggtga acatcgttaa gaaaaccgag gtgcagaccg 3420
gtggattctc taaagagtct atcctcccta agaggaactc tgataagctc attgctagga 3480
agaaggattg ggaccctaag aaatacggtg gtttcgattc tcctaccgtg gcttactctg 3540
ttctcgttgt ggctaaggtt gagaagggaa agagtaagaa gctcaagtct gttaaggaac 3600
ttctcggaat cactatcatg gaaaggtcat ctttcgagaa gaacccaatc gatttcctcg 3660
aggctaaggg atacaaagag gttaagaagg atctcatcat caagctccca aagtactcac 3720
tcttcgaact cgagaacggt agaaagagga tgctcgcttc tgctggtgag cttcaaaagg 3780
gaaacgagct tgctctccca tctaagtacg ttaactttct ttacctcgct tctcactacg 3840
agaagttgaa gggatctcca gaagataacg agcagaagca acttttcgtt gagcagcaca 3900
agcactactt ggatgagatc atcgagcaga tctctgagtt ctctaaaagg gtgatcctcg 3960
ctgatgcaaa cctcgataag gtgttgtctg cttacaacaa gcacagagat aagcctatca 4020
gggaacaggc agagaacatc atccatctct tcacccttac caacctcggt gctcctgctg 4080
ctttcaagta cttcgataca accatcgata ggaagagata cacctctacc aaagaagtgc 4140
tcgatgctac cctcatccat cagtctatca ctggactcta cgagactagg atcgatctct 4200
cacagctcgg tggtgattca agggctgatc ctaagaagaa gaggaaggtt tgaacccagc 4260
tttcttgtac aaagtggggg ttcgaaatcg ataagcttgg atcctctaga gtcctgcttt 4320
aatgagatat gcgagacgcc tatgatcgca tgatatttgc tttcaattct gttgtgcacg 4380
ttgtaaaaaa cctgagcatg tgtagctcag atccttaccg ccggtttcgg ttcattctaa 4440
tgaatatatc acccgttact atcgtatttt tatgaataat attctccgtt caatttactg 4500
attgtaccct actacttata tgtacaatat taaaatgaaa acaatatatt gtgctgaata 4560
ggtttatagc gacatctatg atagagcgcc acaataacaa acaattgcgt tttattatta 4620
caaatccaat tttaaaaaaa gcggcagaac cggtcaaacc taaaagactg attacataaa 4680
tcttattcaa atttcaaaag gccccagggg ctagtatcta cgacacaccg agcggcgaac 4740
taataacgtt cactgaaggg aactccggtt ccccgccggc gcgcatgggt gagattcctt 4800
gaagttgagt attggccgtc cgctctaccg aaagttacgg gcaccattca acccggtcca 4860
gcacggcggc cgggtaaccg acttgctgcc ccgagaatta tgcagcattt ttttggtgta 4920
tgtgggcccc aaatgaagtg caggtcaaac cttgacagtg acgacaaatc gttgggcggg 4980
tccagggcga attttgcgac aacatgtcga ggctcagcag gacctgcagg catgcaagct 5040
agcttactag tgatgcatat tctatagtgt cacctaaatc tgcggccgca ctagtgatat 5100
cccgcggcca tggcggccgg gagcatgcga cgtcgggccc aattcgccct atagtgagtc 5160
gtattacaat tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 5220
ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 5280
ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatgga aattgtaaac 5340
gttaatgggt ttctggagtt taatgagcta agcacatacg tcagaaacca ttattgcgcg 5400
ttcaaaagtc gcctaaggtc actatcagct agcaaatatt tcttgtcaaa aatgctccac 5460
tgacgttcca taaattcccc tcggtatcca attagagtct catattcact ctcaatccaa 5520
ataatctgca atggcaatta ccttatccgc aacttcttta cctatttccg cccggatccg 5580
ggcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 5640
aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 5700
tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 5760
gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 5820
aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 5880
tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 5940
ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 6000
ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 6060
cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 6120
tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 6180
ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 6240
tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 6300
tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gagcgggact 6360
ctggggttcg aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc 6420
accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg 6480
atcctccagc gcggggatct catgctggag ttcttcgccc accccgatcc aacacttacg 6540
tttgcaacgt ccaagagcaa atagaccacg aacgccggaa ggttgccgca gcgtgtggat 6600
tgcgtctcaa ttctctcttg caggaatgca atgatgaata tgatactgac tatgaaactt 6660
tgagggaata ctgcctagca ccgtcacctc ataacgtgca tcatgcatgc cctgacaaca 6720
tggaacatcg ctatttttct gaagaattat gctcgttgga ggatgtcgcg gcaattgcag 6780
ctattgccaa catcgaacta cccctcacgc atgcattcat caatattatt catgcgggga 6840
aaggcaagat taatccaact ggcaaatcat ccagcgtgat tggtaacttc agttccagcg 6900
acttgattcg ttttggtgct acccacgttt tcaataagga cgagatggtg gagtaaagaa 6960
ggagtgcgtc gaagcagatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc 7020
tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat 7080
aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca 7140
attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc 7200
gcgcgcggtg tcatctatgt tactagatcg aattaattca gtacattaaa aacgtccgca 7260
atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag 7320
ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc 7380
catcagtccg ggacggcgtc agcgggagag ccgttgtaag gcggcagact ttgctcatgt 7440
taccgatgct attcggaaga acggcaacta agctgccggg tttgaaacac ggatgatctc 7500
gcggagggta gcatgttgat tgtaacgatg acagagcgtt gctgcctgtg atcaaatatc 7560
atctccctcg cagagatccg aattatcagc cttcttattc atttctcgct taaccgtgac 7620
aggctgtcga tcttgagaac tatgccgaca taataggaaa tcgctggata aagccgctga 7680
ggaagctgag tggcgctatt tctttagaag tgaacgttga cgatgtcgac ggatcttttc 7740
cgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtatatc catccttttt 7800
cgcacgatat acaggatttt gccaaagggt tcgtgtagac tttccttggt gtatccaacg 7860
gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac 7920
tgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag gctggccggc 7980
taccgccggc gtaacagatg agggcaagcg gatggctgat gaaaccaagc caaccagggg 8040
tgatgctgcc aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt 8100
ctgtttctat cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa 8160
gcaccgccgg acatcagcgc tatctctgct ctcactgccg taaaacatgg caactgcagt 8220
tcacttacac cgcttctcaa cccggtacgc accagaaaat cattgatatg gccatgaatg 8280
gcgttggatg ccgggcaaca gcccgcatta tgggcgttgg cctcaacacg attttacgtc 8340
acttaaaaaa ctcaggccgc agtcggtaac ctcgcgcata cagccgggca gtgacgtcat 8400
cgtctgcgcg gaaatggacg aacagtgggg ctatgtcggg gctaaatcgc gccagcgctg 8460
gctgttttac gcgtatgaca gtctccggaa gacggttgtt gcgcacgtat tcggtgaacg 8520
cactatggcg acgctggggc gtcttatgag cctgctgtca ccctttgacg tggtgatatg 8580
gatgacggat ggctggccgc tgtatgaatc ccgcctgaag ggaaagctgc acgtaatcag 8640
caagcgatat acgcagcgaa ttgagcggca taacctgaat ctgaggcagc acctggcacg 8700
gctgggacgg aagtcgctgt cgttctcaaa atcggtggag ctgcatgaca aagtcatcgg 8760
gcattatctg aacataaaac actatcaata agttggagtc attacccaac caggaagggc 8820
agcccaccta tcaaggtgta ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg 8880
gcggcggccg gcatgagcct gtcggcctac ctgctggccg tcggccaggg ctacaaaatc 8940
acgggcgtcg tggactatga gcacgtccgc gagctggccc gcatcaatgg cgacctgggc 9000
cgcctgggcg gcctgctgaa actctggctc accgacgacc cgcgcacggc gcggttcggt 9060
gatgccacga tcctcgccct gctggcgaag atcgaagaga agcaggacga gcttggcaag 9120
gtcatgatgg gcgtggtccg cccgagggca gagccatgac ttttttagcc gctaaaacgg 9180
ccggggggtg cgcgtgattg ccaagcacgt ccccatgcgc tccatcaaga agagcgactt 9240
cgcggagctg gtattcgtgc agggcaagat tcggaatacc aagtacgaga aggacggcca 9300
gacggtctac gggaccgact tcattgccga taaggtggat tatctggaca ccaaggcacc 9360
aggcgggtca aatcaggaat aagggcacat tgccccggcg tgagtcgggg caatcccgca 9420
aggagggtga atgaatcgga cgtttgaccg gaaggcatac aggcaagaac tgatcgacgc 9480
ggggttttcc gccgaggatg ccgaaaccat cgcaagccgc accgtcatgc gtgcgccccg 9540
cgaaaccttc cagtccgtcg gctcgatggt ccagcaagct acggccaaga tcgagcgcga 9600
cagcgtgcaa ctggctcccc ctgccctgcc cgcgccatcg gccgccgtgg agcgttcgcg 9660
tcgtctcgaa caggaggcgg caggtttggc gaagtcgatg accatcgaca cgcgaggaac 9720
tatgacgacc aagaagcgaa aaaccgccgg cgaggacctg gcaaaacagg tcagcgaggc 9780
caagcaggcc gcgttgctga aacacacgaa gcagcagatc aaggaaatgc agctttcctt 9840
gttcgatatt gcgccgtggc cggacacgat gcgagcgatg ccaaacgaca cggcccgctc 9900
tgccctgttc accacgcgca acaagaaaat cccgcgcgag gcgctgcaaa acaaggtcat 9960
tttccacgtc aacaaggacg tgaagatcac ctacaccggc gtcgagctgc gggccgacga 10020
tgacgaactg gtgtggcagc aggtgttgga gtacgcgaag cgcaccccta tcggcgagcc 10080
gatcaccttc acgttctacg agctttgcca ggacctgggc tggtcgatca atggccggta 10140
ttacacgaag gccgaggaat gcctgtcgcg cctacaggcg acggcgatgg gcttcacgtc 10200
cgaccgcgtt gggcacctgg aatcggtgtc gctgctgcac cgcttccgcg tcctggaccg 10260
tggcaagaaa acgtcccgtt gccaggtcct gatcgacgag gaaatcgtcg tgctgtttgc 10320
tggcgaccac tacacgaaat tcatatggga gaagtaccgc aagctgtcgc cgacggcccg 10380
acggatgttc gactatttca gctcgcaccg ggagccgtac ccgctcaagc tggaaacctt 10440
ccgcctcatg tgcggatcgg attccacccg cgtgaagaag tggcgcgagc aggtcggcga 10500
agcctgcgaa gagttgcgag gcagcggcct ggtggaacac gcctgggtca atgatgacct 10560
ggtgcattgc aaacgctagg gccttgtggg gtcagttccg gctgggggtt cagcagccag 10620
cgctttactg gcatttcagg aacaagcggg cactgctcga cgcacttgct tcgctcagta 10680
tcgctcggga cgcacggcgc gctctacgaa ctgccgataa acagaggatt aaaattgaca 10740
attgtgatta aggctcagat tcgacggctt ggagcggccg acgtgcagga tttccgcgag 10800
atccgattgt cggccctgaa gaaagctcca gagatgttcg ggtccgttta cgagcacgag 10860
gagaaaaagc ccatggaggc gttcgctgaa cggttgcgag atgccgtggc attcggcgcc 10920
tacatcgacg gcgagatcat tgggctgtcg gtcttcaaac aggaggacgg ccccaaggac 10980
gctcacaagg cgcatctgtc cggcgttttc gtggagcccg aacagcgagg ccgaggggtc 11040
gccggtatgc tgctgcgggc gttgccggcg ggtttattgc tcgtgatgat cgtccgacag 11100
attccaacgg gaatctggtg gatgcgcatc ttcatcctcg gcgcacttaa tatttcgcta 11160
ttctggagct tgttgtttat ttcggtctac cgcctgccgg gcggggtcgc ggcgacggta 11220
ggcgctgtgc agccgctgat ggtcgtgttc atctctgccg ctctgctagg tagcccgata 11280
cgattgatgg cggtcctggg ggctatttgc ggaactgcgg gcgtggcgct gttggtgttg 11340
acaccaaacg cagcgctaga tcctgtcggc gtcgcagcgg gcctggcggg ggcggtttcc 11400
atggcgttcg gaaccgtgct gacccgcaag tggcaacctc ccgtgcctct gctcaccttt 11460
accgcctggc aactggcggc cggaggactt ctgctcgttc cagtagcttt agtgtttgat 11520
ccgccaatcc cgatgcctac aggaaccaat gttctcggcc tggcgtggct cggcctgatc 11580
ggagcgggtt taacctactt cctttggttc cgggggatct cgcgactcga acctacagtt 11640
gtttccttac tgggctttct cagccgggat ggcgctaaga agctattgcc gccgatcttc 11700
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt 11760
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 11820
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 11880
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 11940
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 12000
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 12060
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 12120
tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 12180
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 12240
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 12300
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 12360
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 12420
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 12480
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atatcaagaa gatcctttga 12540
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 12600
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 12660
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 12720
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 12780
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 12840
acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 12900
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaaacaa gtggcagcaa 12960
cggattcgca aacctgtcac gccttttgtg ccaaaagccg cgccaggttt gcgatccgct 13020
gtgccaggcg ttaggcgtca tatgaagatt tcggtgatcc ctgagcaggt ggcggaaaca 13080
ttggatgctg agaaccattt cattgttcgt gaagtgttcg atgtgcacct atccgaccaa 13140
ggctttgaac tatctaccag aagtgtgagc ccctaccgga aggattacat ctcggatgat 13200
gactctgatg aagactctgc ttgctatggc gcattcatcg accaagagct tgtcgggaag 13260
attgaactca actcaacatg gaacgatcta gcctctatcg aacacattgt tgtgtcgcac 13320
acgcaccgag gcaaaggagt cgcgcacagt ctcatcgaat ttgcgaaaaa gtgggcacta 13380
agcagacagc tccttggcat acgattagag acacaaacga acaatgtacc tgcctgcaat 13440
ttgtacgcaa aatgtggctt tactctcggc ggcattgacc tgttcacgta taaaactaga 13500
cctcaagtct cgaacgaaac agcgatgtac tggtactggt tctcgggagc acaggatgac 13560
gcctaacaat tcattcaagc cgacaccgct tcgcggcgcg gcttaattca ggagttaaac 13620
atcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 13680
atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 13740
ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 13800
gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 13860
agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 13920
cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 13980
ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 14040
gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 14100
caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 14160
gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 14220
ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 14280
tatcagcccg tcatacttga agctaggcag gcttatcttg gacaagaaga tcgcttggcc 14340
tcgcgcgcag atcagttgga agaatttgtt cactacgtga aaggcgagat caccaaggta 14400
gtcggcaaat aatgtctaac aattcgttca agccgacgcc gcttcgcggc gcggcttaac 14460
tcaagcgtta gagagctggg gaagactatg cgcgatctgt tgaaggtggt tctaagcctc 14520
gtacttgcga tggcatcggg gcaggcactt gctgacctgc caattgtttt agtggatgaa 14580
gctcgtcttc cctatgacta ctccccatcc aactacgaca tttctccaag caactacgac 14640
aactccataa gcaattacga caatagtcca tcaaattacg acaactctga gagcaactac 14700
gataatagtt catccaatta cgacaatagt cgcaacggaa atcgtaggct tatatatagc 14760
gcaaatgggt ctcgcacttt cgccggctac tacgtcattg ccaacaatgg gacaacgaac 14820
ttcttttcca catctggcaa aaggatgttc tacaccccaa aaggggggcg cggcgtctat 14880
ggcggcaaag atgggagctt ctgcggggca ttggtcgtca taaatggcca attttcgctt 14940
gccctgacag ataacggcct gaagatcatg tatctaagca actagcctgc tctctaataa 15000
aatgttagga gcttggctgc catttttggg gtgaggccgt tcgcggccga ggggcgcagc 15060
ccctgggggg atgggaggcc cgcgttagcg ggccgggagg gttcgagaag ggggggcacc 15120
ccccttcggc gtgcgcggtc acgcgccagg gcgcagccct ggttaaaaac aaggtttata 15180
aatattggtt taaaagcagg ttaaaagaca ggttagcggt ggccgaaaaa cgggcggaaa 15240
cccttgcaaa tgctggattt tctgcctgtg gacagcccct caaatgtcaa taggtgcgcc 15300
cctcatctgt cagcactctg cccctcaagt gtcaaggatc gcgcccctca tctgtcagta 15360
gtcgcgcccc tcaagtgtca ataccgcagg gcacttatcc ccaggcttgt ccacatcatc 15420
tgtgggaaac tcgcgtaaaa tcaggcgttt tcgccgattt gcgaggctgg ccagctccac 15480
gtcgccggcc gaaatcgagc ctgcccctca tctgtcaacg ccgcgccggg tgagtcggcc 15540
cctcaagtgt caacgtccgc ccctcatctg tcagtgaggg ccaagttttc cgcgaggtat 15600
ccacaacgcc ggcggccggc cgcggtgtct cgcacacggc ttcgacggcg tttctggcgc 15660
gtttgcaggg ccatagacgg ccgccagccc agcggcgagg gcaaccagcc cggtgagcgt 15720
cggaaagggt cgacatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc 15780
ggattgaagg cgagatccag caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg 15840
tgatgactgg ccaggacgtc ggccgaaaga gcgacaagca gatcacgatt ttcgacagcg 15900
tcggatttgc gatcgaggat ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat 15960
caagccacag cagcccactc gaccttctag ccgacccaga cgagccaagg gatctttttg 16020
gaatgctgct ccgtcgtcag gctttccgac gtttgggtgg ttgaacagaa gtcattatcg 16080
tacggaatgc cagcactccc gaggggaacc ctgtggttgg catgcacata caaatggacg 16140
aacggataaa ccttttcacg cccttttaaa tatccgttat tctaataaac gctcttttct 16200
cttaggttta cccgccaata tatcctgtca aacactgata gtttaaactg aaggcgggaa 16260
acgacaatct gatcatgagc ggagaattaa gggagtcacg ttatgacccc cgccgatgac 16320
gcgggacaag ccgttttacg tttggaactg acagaaccgc aacgattgaa ggagccactc 16380
agccccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 16440
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 16500
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 16560
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagctatt 16620
taggtgacac tatagaatac tcaagctatg catccaacgc gttgggagct ctcccatatc 16680
gacctgcagg cggccgctcg acgaattaat tccaatccca caaaaatctg agcttaacag 16740
cacagttgct cctctcagag cagaatcggg tattcaacac cctcatatca actactacgt 16800
tgtgtataac ggtccacatg ccggtatata cgatgactgg ggttgtacaa aggcggcaac 16860
aaacggcgtt cccggagttg cacacaagaa atttgccact attacagagg caagagcagc 16920
agctgacgcg tacacaacaa gtcagcaaac agacaggttg aacttcatcc ccaaaggaga 16980
agctcaactc aagcccaaga gctttgctaa ggccctaaca agcccaccaa agcaaaaagc 17040
ccactggctc acgctaggaa ccaaaaggcc cagcagtgat ccagccccaa aagagatctc 17100
ctttgccccg gagattacaa tggacgattt cctctatctt tacgatctag gaaggaagtt 17160
cgaaggtgaa ggtgacgaca ctatgttcac cactgataat gagaaggtta gcctcttcaa 17220
tttcagaaag aatgctgacc cacagatggt tagagaggcc tacgcagcag gtctcatcaa 17280
gacgatctac ccgagtaaca atctccagga gatcaaatac cttcccaaga aggttaaaga 17340
tgcagtcaaa agattcagga ctaattgcat caagaacaca gagaaagaca tatttctcaa 17400
gatcagaagt actattccag tatggacgat tcaaggcttg cttcataaac caaggcaagt 17460
aatagagatt ggagtctcta aaaaggtagt tcctactgaa tctaaggcca tgcatggagt 17520
ctaagattca aatcgaggat ctaacagaac tcgccgtgaa gactggcgaa cagttcatac 17580
agagtctttt acgactcaat gacaagaaga aaatcttcgt caacatggtg gagcacgaca 17640
ctctggtcta ctccaaaaat gtcaaagata cagtctcaga agaccaaagg gctattgaga 17700
cttttcaaca aaggataatt tcgggaaacc tcctcggatt ccattgccca gctatctgtc 17760
acttcatcga aaggacagta gaaaaggaag gtggctccta caaatgccat cattgcgata 17820
aaggaaaggc tatcattcaa gatctctctg ccgacagtgg tcccaaagat ggacccccac 17880
ccacgaggag catcgtggaa aaagaagacg ttccaaccac gtcttcaaag caagtggatt 17940
gatgtgacat ctccactgac gtaagggatg acgcacaatc ccactatcct tcgcaagacc 18000
cttcctctat ataaggaagt tcatttcatt tggagaggac acgctcgagg aattcggtac 18060
ccc 18063
<210> 60
<211> 12150
<212> DNA
<213> 人工序列
<220>
<223> U6-26 启动子 Ps#1 gRNA
<400> 60
acctagggag ctctcccata tcgacctgca ggcggccgca ctagtgatat cccgcggcca 60
tggcggccgg gagcatgcga cgtcgggccc aattcgccct atagtgagtc gtattacaat 120
tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 180
cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 240
cgcccttccc aacagttgcg cagcctgaat ggcgaatgga aattgtaaac gttaatgggt 300
ttctggagtt taatgagcta agcacatacg tcagaaacca ttattgcgcg ttcaaaagtc 360
gcctaaggtc actatcagct agcaaatatt tcttgtcaaa aatgctccac tgacgttcca 420
taaattcccc tcggtatcca attagagtct catattcact ctcaatccaa ataatctgca 480
atggcaatta ccttatccgc aacttcttta cctatttccg cccggatccg ggcaggttct 540
ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc 600
tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc 660
gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc 720
acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 780
ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 840
aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 900
ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 960
cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc 1020
gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc 1080
tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 1140
ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag 1200
cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg 1260
cagcgcatcg ccttctatcg ccttcttgac gagttcttct gagcgggact ctggggttcg 1320
aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc accgccgcct 1380
tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg atcctccagc 1440
gcggggatct catgctggag ttcttcgccc accccgatcc aacacttacg tttgcaacgt 1500
ccaagagcaa atagaccacg aacgccggaa ggttgccgca gcgtgtggat tgcgtctcaa 1560
ttctctcttg caggaatgca atgatgaata tgatactgac tatgaaactt tgagggaata 1620
ctgcctagca ccgtcacctc ataacgtgca tcatgcatgc cctgacaaca tggaacatcg 1680
ctatttttct gaagaattat gctcgttgga ggatgtcgcg gcaattgcag ctattgccaa 1740
catcgaacta cccctcacgc atgcattcat caatattatt catgcgggga aaggcaagat 1800
taatccaact ggcaaatcat ccagcgtgat tggtaacttc agttccagcg acttgattcg 1860
ttttggtgct acccacgttt tcaataagga cgagatggtg gagtaaagaa ggagtgcgtc 1920
gaagcagatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt 1980
cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg 2040
taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt 2100
taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg 2160
tcatctatgt tactagatcg aattaattca gtacattaaa aacgtccgca atgtgttatt 2220
aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag ccagccaaca 2280
gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc catcagtccg 2340
ggacggcgtc agcgggagag ccgttgtaag gcggcagact ttgctcatgt taccgatgct 2400
attcggaaga acggcaacta agctgccggg tttgaaacac ggatgatctc gcggagggta 2460
gcatgttgat tgtaacgatg acagagcgtt gctgcctgtg atcaaatatc atctccctcg 2520
cagagatccg aattatcagc cttcttattc atttctcgct taaccgtgac aggctgtcga 2580
tcttgagaac tatgccgaca taataggaaa tcgctggata aagccgctga ggaagctgag 2640
tggcgctatt tctttagaag tgaacgttga cgatgtcgac ggatcttttc cgctgcataa 2700
ccctgcttcg gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat 2760
acaggatttt gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg 2820
ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat 2880
tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc 2940
gtaacagatg agggcaagcg gatggctgat gaaaccaagc caaccagggg tgatgctgcc 3000
aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt ctgtttctat 3060
cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa gcaccgccgg 3120
acatcagcgc tatctctgct ctcactgccg taaaacatgg caactgcagt tcacttacac 3180
cgcttctcaa cccggtacgc accagaaaat cattgatatg gccatgaatg gcgttggatg 3240
ccgggcaaca gcccgcatta tgggcgttgg cctcaacacg attttacgtc acttaaaaaa 3300
ctcaggccgc agtcggtaac ctcgcgcata cagccgggca gtgacgtcat cgtctgcgcg 3360
gaaatggacg aacagtgggg ctatgtcggg gctaaatcgc gccagcgctg gctgttttac 3420
gcgtatgaca gtctccggaa gacggttgtt gcgcacgtat tcggtgaacg cactatggcg 3480
acgctggggc gtcttatgag cctgctgtca ccctttgacg tggtgatatg gatgacggat 3540
ggctggccgc tgtatgaatc ccgcctgaag ggaaagctgc acgtaatcag caagcgatat 3600
acgcagcgaa ttgagcggca taacctgaat ctgaggcagc acctggcacg gctgggacgg 3660
aagtcgctgt cgttctcaaa atcggtggag ctgcatgaca aagtcatcgg gcattatctg 3720
aacataaaac actatcaata agttggagtc attacccaac caggaagggc agcccaccta 3780
tcaaggtgta ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg 3840
gcatgagcct gtcggcctac ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg 3900
tggactatga gcacgtccgc gagctggccc gcatcaatgg cgacctgggc cgcctgggcg 3960
gcctgctgaa actctggctc accgacgacc cgcgcacggc gcggttcggt gatgccacga 4020
tcctcgccct gctggcgaag atcgaagaga agcaggacga gcttggcaag gtcatgatgg 4080
gcgtggtccg cccgagggca gagccatgac ttttttagcc gctaaaacgg ccggggggtg 4140
cgcgtgattg ccaagcacgt ccccatgcgc tccatcaaga agagcgactt cgcggagctg 4200
gtattcgtgc agggcaagat tcggaatacc aagtacgaga aggacggcca gacggtctac 4260
gggaccgact tcattgccga taaggtggat tatctggaca ccaaggcacc aggcgggtca 4320
aatcaggaat aagggcacat tgccccggcg tgagtcgggg caatcccgca aggagggtga 4380
atgaatcgga cgtttgaccg gaaggcatac aggcaagaac tgatcgacgc ggggttttcc 4440
gccgaggatg ccgaaaccat cgcaagccgc accgtcatgc gtgcgccccg cgaaaccttc 4500
cagtccgtcg gctcgatggt ccagcaagct acggccaaga tcgagcgcga cagcgtgcaa 4560
ctggctcccc ctgccctgcc cgcgccatcg gccgccgtgg agcgttcgcg tcgtctcgaa 4620
caggaggcgg caggtttggc gaagtcgatg accatcgaca cgcgaggaac tatgacgacc 4680
aagaagcgaa aaaccgccgg cgaggacctg gcaaaacagg tcagcgaggc caagcaggcc 4740
gcgttgctga aacacacgaa gcagcagatc aaggaaatgc agctttcctt gttcgatatt 4800
gcgccgtggc cggacacgat gcgagcgatg ccaaacgaca cggcccgctc tgccctgttc 4860
accacgcgca acaagaaaat cccgcgcgag gcgctgcaaa acaaggtcat tttccacgtc 4920
aacaaggacg tgaagatcac ctacaccggc gtcgagctgc gggccgacga tgacgaactg 4980
gtgtggcagc aggtgttgga gtacgcgaag cgcaccccta tcggcgagcc gatcaccttc 5040
acgttctacg agctttgcca ggacctgggc tggtcgatca atggccggta ttacacgaag 5100
gccgaggaat gcctgtcgcg cctacaggcg acggcgatgg gcttcacgtc cgaccgcgtt 5160
gggcacctgg aatcggtgtc gctgctgcac cgcttccgcg tcctggaccg tggcaagaaa 5220
acgtcccgtt gccaggtcct gatcgacgag gaaatcgtcg tgctgtttgc tggcgaccac 5280
tacacgaaat tcatatggga gaagtaccgc aagctgtcgc cgacggcccg acggatgttc 5340
gactatttca gctcgcaccg ggagccgtac ccgctcaagc tggaaacctt ccgcctcatg 5400
tgcggatcgg attccacccg cgtgaagaag tggcgcgagc aggtcggcga agcctgcgaa 5460
gagttgcgag gcagcggcct ggtggaacac gcctgggtca atgatgacct ggtgcattgc 5520
aaacgctagg gccttgtggg gtcagttccg gctgggggtt cagcagccag cgctttactg 5580
gcatttcagg aacaagcggg cactgctcga cgcacttgct tcgctcagta tcgctcggga 5640
cgcacggcgc gctctacgaa ctgccgataa acagaggatt aaaattgaca attgtgatta 5700
aggctcagat tcgacggctt ggagcggccg acgtgcagga tttccgcgag atccgattgt 5760
cggccctgaa gaaagctcca gagatgttcg ggtccgttta cgagcacgag gagaaaaagc 5820
ccatggaggc gttcgctgaa cggttgcgag atgccgtggc attcggcgcc tacatcgacg 5880
gcgagatcat tgggctgtcg gtcttcaaac aggaggacgg ccccaaggac gctcacaagg 5940
cgcatctgtc cggcgttttc gtggagcccg aacagcgagg ccgaggggtc gccggtatgc 6000
tgctgcgggc gttgccggcg ggtttattgc tcgtgatgat cgtccgacag attccaacgg 6060
gaatctggtg gatgcgcatc ttcatcctcg gcgcacttaa tatttcgcta ttctggagct 6120
tgttgtttat ttcggtctac cgcctgccgg gcggggtcgc ggcgacggta ggcgctgtgc 6180
agccgctgat ggtcgtgttc atctctgccg ctctgctagg tagcccgata cgattgatgg 6240
cggtcctggg ggctatttgc ggaactgcgg gcgtggcgct gttggtgttg acaccaaacg 6300
cagcgctaga tcctgtcggc gtcgcagcgg gcctggcggg ggcggtttcc atggcgttcg 6360
gaaccgtgct gacccgcaag tggcaacctc ccgtgcctct gctcaccttt accgcctggc 6420
aactggcggc cggaggactt ctgctcgttc cagtagcttt agtgtttgat ccgccaatcc 6480
cgatgcctac aggaaccaat gttctcggcc tggcgtggct cggcctgatc ggagcgggtt 6540
taacctactt cctttggttc cgggggatct cgcgactcga acctacagtt gtttccttac 6600
tgggctttct cagccgggat ggcgctaaga agctattgcc gccgatcttc atatgcggtg 6660
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 6720
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6780
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6840
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6900
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6960
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 7020
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 7080
tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 7140
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 7200
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 7260
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 7320
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7380
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7440
caagcagcag attacgcgca gaaaaaaagg atatcaagaa gatcctttga tcttttctac 7500
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7560
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7620
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 7680
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 7740
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 7800
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 7860
tcctgcaact ttatccgcct ccatccagtc tattaaacaa gtggcagcaa cggattcgca 7920
aacctgtcac gccttttgtg ccaaaagccg cgccaggttt gcgatccgct gtgccaggcg 7980
ttaggcgtca tatgaagatt tcggtgatcc ctgagcaggt ggcggaaaca ttggatgctg 8040
agaaccattt cattgttcgt gaagtgttcg atgtgcacct atccgaccaa ggctttgaac 8100
tatctaccag aagtgtgagc ccctaccgga aggattacat ctcggatgat gactctgatg 8160
aagactctgc ttgctatggc gcattcatcg accaagagct tgtcgggaag attgaactca 8220
actcaacatg gaacgatcta gcctctatcg aacacattgt tgtgtcgcac acgcaccgag 8280
gcaaaggagt cgcgcacagt ctcatcgaat ttgcgaaaaa gtgggcacta agcagacagc 8340
tccttggcat acgattagag acacaaacga acaatgtacc tgcctgcaat ttgtacgcaa 8400
aatgtggctt tactctcggc ggcattgacc tgttcacgta taaaactaga cctcaagtct 8460
cgaacgaaac agcgatgtac tggtactggt tctcgggagc acaggatgac gcctaacaat 8520
tcattcaagc cgacaccgct tcgcggcgcg gcttaattca ggagttaaac atcatgaggg 8580
aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc atcgagcgcc 8640
atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat ggcggcctga 8700
agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat gaaacaacgc 8760
ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag agcgagattc 8820
tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg cgttatccag 8880
ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca ggtatcttcg 8940
agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga gaacatagcg 9000
ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa caggatctat 9060
ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg gctggcgatg 9120
agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc ggcaaaatcg 9180
cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag tatcagcccg 9240
tcatacttga agctaggcag gcttatcttg gacaagaaga tcgcttggcc tcgcgcgcag 9300
atcagttgga agaatttgtt cactacgtga aaggcgagat caccaaggta gtcggcaaat 9360
aatgtctaac aattcgttca agccgacgcc gcttcgcggc gcggcttaac tcaagcgtta 9420
gagagctggg gaagactatg cgcgatctgt tgaaggtggt tctaagcctc gtacttgcga 9480
tggcatcggg gcaggcactt gctgacctgc caattgtttt agtggatgaa gctcgtcttc 9540
cctatgacta ctccccatcc aactacgaca tttctccaag caactacgac aactccataa 9600
gcaattacga caatagtcca tcaaattacg acaactctga gagcaactac gataatagtt 9660
catccaatta cgacaatagt cgcaacggaa atcgtaggct tatatatagc gcaaatgggt 9720
ctcgcacttt cgccggctac tacgtcattg ccaacaatgg gacaacgaac ttcttttcca 9780
catctggcaa aaggatgttc tacaccccaa aaggggggcg cggcgtctat ggcggcaaag 9840
atgggagctt ctgcggggca ttggtcgtca taaatggcca attttcgctt gccctgacag 9900
ataacggcct gaagatcatg tatctaagca actagcctgc tctctaataa aatgttagga 9960
gcttggctgc catttttggg gtgaggccgt tcgcggccga ggggcgcagc ccctgggggg 10020
atgggaggcc cgcgttagcg ggccgggagg gttcgagaag ggggggcacc ccccttcggc 10080
gtgcgcggtc acgcgccagg gcgcagccct ggttaaaaac aaggtttata aatattggtt 10140
taaaagcagg ttaaaagaca ggttagcggt ggccgaaaaa cgggcggaaa cccttgcaaa 10200
tgctggattt tctgcctgtg gacagcccct caaatgtcaa taggtgcgcc cctcatctgt 10260
cagcactctg cccctcaagt gtcaaggatc gcgcccctca tctgtcagta gtcgcgcccc 10320
tcaagtgtca ataccgcagg gcacttatcc ccaggcttgt ccacatcatc tgtgggaaac 10380
tcgcgtaaaa tcaggcgttt tcgccgattt gcgaggctgg ccagctccac gtcgccggcc 10440
gaaatcgagc ctgcccctca tctgtcaacg ccgcgccggg tgagtcggcc cctcaagtgt 10500
caacgtccgc ccctcatctg tcagtgaggg ccaagttttc cgcgaggtat ccacaacgcc 10560
ggcggccggc cgcggtgtct cgcacacggc ttcgacggcg tttctggcgc gtttgcaggg 10620
ccatagacgg ccgccagccc agcggcgagg gcaaccagcc cggtgagcgt cggaaagggt 10680
cgacatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg 10740
cgagatccag caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg 10800
ccaggacgtc ggccgaaaga gcgacaagca gatcacgatt ttcgacagcg tcggatttgc 10860
gatcgaggat ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag 10920
cagcccactc gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct 10980
ccgtcgtcag gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc 11040
cagcactccc gaggggaacc ctgtggttgg catgcacata caaatggacg aacggataaa 11100
ccttttcacg cccttttaaa tatccgttat tctaataaac gctcttttct cttaggttta 11160
cccgccaata tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatct 11220
gatcatgagc ggagaattaa gggagtcacg ttatgacccc cgccgatgac gcgggacaag 11280
ccgttttacg tttggaactg acagaaccgc aacgattgaa ggagccactc agccccaata 11340
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 11400
cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag 11460
gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga 11520
taacaatttc acacaggaaa cagctatgac catgattacg ccaagctatt taggtgacac 11580
tatagaatac tcaagctatg catccaacgc gttgggagct ccctaggctt tttttcttct 11640
tcttcgttca tacagttttt ttttgtttat cagcttacat tttcttgaac cgtagctttc 11700
gttttcttct ttttaacttt ccattcggag tttttgtatc ttgtttcata gtttgtccca 11760
ggattagaat gattaggcat cgaaccttca agaatttgat tgaataaaac atcttcattc 11820
ttaagatatg aagataatct tcaaaaggcc cctgggaatc tgaaagaaga gaagcaggcc 11880
catttatatg ggaaagaaca atagtatttc ttatataggc ccatttaagt tgaaaacaat 11940
cttcaaaagt cccacatcgc ttagataaga aaacgaagct gagtttatat acagctagag 12000
tcgaagtagt gattgaatgt ctgttgcctt gttagtttta gagctagaaa tagcaagtta 12060
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc tttttttcta 12120
gacccagctt tcttgtacaa agttggcatt 12150
<210> 61
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> gRNA分子等位基因特异性DSB +等位基因修复
<400> 61
ggagcgtata taatgctgct tgttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt tttt 104
<210> 62
<211> 13688
<212> DNA
<213> 人工序列
<220>
<223> R1 质粒
<400> 62
ggagcaacct tattttgtac tttaaaaaat tcattttttt tattttttcg actttaaagc 60
caaaattatc ctttatttat gaaagtggat gtatttttat ccctttaata taaggttgag 120
ttttctttaa gtttgtaatg ttaagtgggg cactttatat tagtccaatt aacagaattg 180
acttagaaat tgatggcgat tacttgaaaa aatcgctaca aaaacataat aaaataaaat 240
ttcatttgat ttttaaacca aaagaaaagt gacatgacta acgatttgat cccatcttct 300
ttttttttta agaaaaaaat taaaagaaaa atttattaaa ctggatgatt aattttaaca 360
taaaaattaa aaaaataaaa atcaatcgag ctcactattt gatattatta ttttcatctt 420
gatattgtta cttcatatca ctgaattata aaatgcgtta acggcaatta tcatagacgc 480
agactgaaag cataaaatta caactattcc atttttgttt tttttttgcc aacccaaaaa 540
aaactaataa tttatttaca taattataga aaattggaat ttattcatgt ttttggacca 600
ttcagataac cccacaataa aaaaaaagtg cacaaaagtg caaagtgcta cgtgtcctaa 660
ttatagccat actacatttg tgcataaaat tagccaccat tatttttaag attattcttt 720
ttcttgtttt aatttatatg ccacactttc ttattaatcc atcttaaaca gaatgacaca 780
ctttttattt gacaaatatt taatgacatt attaacattt tatcctcgtt agatttcact 840
tatttggtta aaggtggtgt acttttctaa tctaaaatca ttaattttag gtataatttt 900
agaacattgc aaagcctttt catatattta aacaatgtac ataattatgt aattatgtta 960
tgttatataa attgagacga aaaaaatatt atttatcagg tacgagtgtc actttacact 1020
agaggtgttt acggacagag acgaatccaa gatttgaact tcatggtgtc aagtatacac 1080
attgcttaga ttattaaatc aactttaggt ttcaattccg cacaaaatct ataaaacata 1140
acctttttaa aaataatttt actaatatta taaacatata ttattcattt ataatagttc 1200
tcgacgagtt tacatatttt caaaactgtc aattagaaca tcattactta tatttgtaaa 1260
tgtatcactt actacgtaac aaactaaaca aatcatttga atatcactca tcactcttat 1320
ttatatttta tttttttatc tacttcacca aagaaaatga taatttcaca attgcgattg 1380
ctaccagaaa aatatttact taatcaattt taaaaagatt aagtaataga aatatttttt 1440
attttattaa gaaaagagga ttttatcata tctaaatata aattaaagat gaagttacta 1500
tgatattatt taaaaagtaa atgacattat tctatttaaa ttacaaaatg agattaagaa 1560
aagtataact atttccattt ttttagctaa aaggatttca aaaaaaaaag taacaagaaa 1620
gagatttttt aaaaataata attttattag aaatatatat aaaaaattaa taatattcgt 1680
tagaaaaagt gaattttcaa aataataaag taataacacg aatactttta gggtcaaaca 1740
attaatagtg gagaatggag atatttttag tacaaattat ttatacaaaa tatctttatt 1800
caatgtgaca taattttaag ctatttttaa cacttttcca tcaaataaat aattaataac 1860
aaattattaa aaaatcaaag attaataaat taaattaatg aactataatt agttattaaa 1920
accaagccaa ctagaattaa atagaaaaaa ggaaatataa tcttcaaaat atgctttgtt 1980
gaagtataat tcctcgtcta tttaaagctt cggagattta aattggcaag cgaattacac 2040
aaagcaaatg aaactacacc ttttggttct gtgggtgtca tttgcttatt tataaacatt 2100
gtacatatat acacctatat gtatatcacg tttcgatcga agctcgtggg tggcgtggca 2160
cccataaatc gtagtagatt cgcccctgtt tacggatcga tttaggtcgg ttatagatca 2220
aaatcaaatc aatttaatta attttaccaa tcaaaccaaa tcaaatatac tatacattta 2280
ttggtttggt tgttcgaatt tcgatttgat ttgattcaat tattcgatta tcaatcatac 2340
agaaataaaa gaaacaattc attttaaaga ggaacaaaag aggcaagaac tcattcaaaa 2400
tgaaaaatac ttaaaatagc cgaatttata aaacttttta ttactaaatt tactgtgaat 2460
aaaactttta aattcaccat tttagcctag aagtaagaga gaaaaacatt tccaccaaga 2520
attgtcaaga atactcatat acatgaaacc aatatgataa atgttctctt caggacggtt 2580
cataaataaa ttatgataaa catatataag atatttaaaa taaaataaaa tatatatata 2640
taaaatttat cggttcgatt atttcttcaa ctttttaaat aaaatcaaag actatcaatt 2700
cttaagaatc ttagaacaaa ctaaaccaaa taaaattaaa cgatttaatc aacttaattt 2760
aatttttcaa tgtgggtcaa tttttatcca aatactttta cacccacttt tcaccatcac 2820
aaggggtaag aactagcaaa ttattttgcc ttaacaaaaa cttactattg gtgtagagaa 2880
aattggttga ttttcttatc aatatatata atttagtacc caattttccc aaaactaaat 2940
aaaatataga atatccacta aggtggttac acgtgtacac tcaaccaatg acggcacttc 3000
aaattcttga taacggtatc ttcccacctt catatatttc aacattttat tgttaaaata 3060
aaatcgcacg ctctatttta tctaaatttt atttatagaa ttatattaag tatgttatta 3120
ttaattttta cgtataaata tatttcatat taaaatcata taagttgaca tcactaagtt 3180
cgttggattt gcatgtagac ccaattattc agatactcaa catgactcat ttaatattgg 3240
attattgaaa tatttgtaat acattaagaa tataattgtt aactatttta atttttaatt 3300
atacgtaaat atcaaacaaa aatattaata tgatcgctat attagatgat aactataagg 3360
agcctacaca attaacacta tttaactcta ttctttgcat ttataaaaag ttactttagt 3420
cttaggttca caatgtcaaa atctaaacaa ctaaaaacga cgaggagtaa ggtttgcaac 3480
gacgataaca aggattaggc aacaattaga gttgtgaatt gtgagtatta actatacttt 3540
tactatatta ggcagaattt ttgcactcaa tgagtaactt gatttattta ttttttattt 3600
cgccctaaat tattggacaa gtcatatatt tgttttgaaa acattctttt attggctaaa 3660
tcgaaaattg aatcgttaaa gatcaaaaat caataacaaa tatcttattg gtttaacata 3720
tttaaaaata aaaaaccaat aaatctaact aataatattt aatacgaaaa cgaaatggac 3780
tgacacacat tcctaaattt ttggtcaaaa ttttttcata atttccctaa aatctaaaat 3840
attaaatatt tgacggaaac aaaaaattca cttttaataa attatttgaa ggactaaaac 3900
agtggaagaa tatatttaag aagctaattt gaacctagtg ccaaatataa agggaccatt 3960
tttgtcattt ttcaacttga aaatctacgt gtcttaatat aacaccaaag aattaatatt 4020
tactgaaaaa atgtaaaaat gaggatatgg attctgaatc actcaattcc aatcagcaaa 4080
aataaaataa aataaaataa aataaaattt aaaaaataat aataaatgct ataaaatgac 4140
caaaatgtgt ggagcaaaaa gtgcagaaaa aaccaacaaa ttgcattctc cattcttgga 4200
agtggccatt cttgatttct tgaaacaaag gtttgtttcc cttcacttct tgatatgtaa 4260
agttgcaatc tttataactt tctattgctt tgctagtgtt tttgttatat acagggggtg 4320
gagttagagg gtaagttacg catttagtcg taactttagt caaacttcgt aataatttag 4380
taagttaaaa tatattagaa attttcagaa ttcataaact ttaaatttta aattttgact 4440
tcgctttgtg tgactataca attacagaaa ttcagagtgg ccattgttga aagagagggt 4500
ggaatttgtg taagttttgt ttcctttcag ttcttgatat ataaagttgc aatctttaac 4560
attctttgtt cactttctat aggtttgcta ggttcggtta aattcagtag ctttagttta 4620
aaccctatgc ggaatagaga atgtgtaaac tttaaacttc aaattttggc tccgcatacg 4680
actagcgact atataataat aggaattgag cacttggctt ttgtatatag cttctatgtg 4740
taccaaaatt agaaaatcag gcgattatta taatcttgtt gactaaatat agaatgcatc 4800
cattaccccc aaaaagtgtg attccactgt cataggaggt tttttttatt tcattttatt 4860
tgtgctttca ataatgtaga gtagttttac aaagatcctt tctttgtgac acatggtagg 4920
taatattgct gattttgttg tagttttggg gttataaagt ttcaaattat ttatactgga 4980
gggtaggggt gggggttgtc tataatgcag gttatggttt tacgtgaact caataattat 5040
tgtagatact aagaaatcca ctcagtgttc ttgcggtgtc ttgcttttga tttcagcatc 5100
acttgtagtt gattgtgttt agattatcac attattctgt ggctgtaact gtatccttgt 5160
tagttgcttt gtttctacac tgttgttttc cctcttttat acctattttg atatgttgta 5220
ctcgaacgag ggtcatcggg gaacaacctc tttacctccg tgaggtagag ctatggtctg 5280
tgtccactct accctcccca gatccctctt gtaggatttc actatattgt aatattaact 5340
tgaggtcact ataggagctc aaaaacttct aattttgaat caatgtctgg ttatactttt 5400
tttgtcataa ctgtatctca aatgtggtgt ttggtttatc tcattttgca gaagtcaaga 5460
aacaggttac tcctgtttga gtgaggaaaa gttggtttgc ctgtctgtgg tctttttata 5520
atctttttct acagaagaga aagtgggtaa ttttgtttga gagtggaaat attctctagt 5580
gggaatctac taggagtaat ttattttcta taaactaagt aaagtttgga aggtgacaaa 5640
aagaaagaca aaaatcttgg aattgtttta gacaaccaag gttttcttgc tcagaatgtc 5700
tgttgccttg ttatgggttg tttctccttg tgacgtctca aatgggacaa gtttcatgga 5760
atcagtccgg gagggaaacc gtttttttga ttcatcgagg cataggaatt tggtgtccaa 5820
tgagagaatc aatagaggtg gtggaaagca aactaataat ggacggaaat tttctgtacg 5880
gtctgctatt ttggctactc catctggaga acggacgatg acatcggaac agatggtcta 5940
tgatgtggtt ttgaggcagg cagccttggt gaagaggcaa ctgagatcta ccaatgagtt 6000
agaagtgaag ccggatatac ctattccggg gaatttgggc ttgttgagtg aagcatatga 6060
taggtgtggt gaagtatgtg cagagtatgc aaagacgttt aacttaggtt agcttcttca 6120
atctattcat tcgtttacca aatattattt ggtaagcact aattatgaat atatatatgt 6180
tcatgttatt gatgaagaca aaatttgatc tttgtttgtt tattcaggaa ctatgctaat 6240
gactcccgag agaagaaggg ctatctgggc aatatatggt gaggtttcta gccatttaat 6300
aacagttacg cgcacaaaca catatgatta atcggggacg agaaaaaaag aaatgaagtt 6360
tgagttttga gggtcatatg taataggtaa atccgagctt gactagcttg agatgtttat 6420
tgtcatatca tgctcaatac taaccaaaac actgaaaaag aacttgatta tatttacata 6480
ctaatatttt catttgcgtt gctgttcaca tttttaccta tggaactggt ttttgtgatt 6540
tgttatactt catattcgat gttaataaaa tatatcattc ctcccttttt ctccacttca 6600
agctttactg tagtgttgaa aggggaaact ccttttaatg attgcatata taaacgaact 6660
tcttgagttg aatagtttct cattatgatc tgtttaaaca gtatggtgca gaagaacaga 6720
tgaacttgtt gatggcccaa acgcatcata tattaccccg gcagccttag ataggtggga 6780
aaataggcta gaagatgttt tcaatgggcg gccatttgac atgctcgatg gtgctttgtc 6840
cgatacagtt tctaactttc cagttgatat tcaggttagt ctaccaattc tatggtcttt 6900
atatttgttc aatttgcgtt tgatgtcact tttgctgagg gcttttctaa tagcttactt 6960
cagcctagcg gaaatgtttg tagttgaatc tctagttctg tctcctatat ctgtttctct 7020
cgtcctagat actacacata cttcatttct gttttaacat tttattcgtc ttttggtgtt 7080
gttttgtatg tgaatcatat atttggaaca gaatcattat tagttcacat gatttcattt 7140
gctttcttca atagcgtaat tgtctaacct tccaatatat gttgcagcca ttcagagata 7200
tgattgaagg aatgcgtatg gacttgagaa aatcgagata caaaaacttc gacgaactat 7260
acctttattg ttattatgtt gctggtacgg ttgggttgat gagtgttcca attatggcgc 7320
tgtcatgaga cgaattctga caggatatat tggcgggtaa acctaagaga aaagagcgtt 7380
tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg tccatttgta 7440
tgtgcatgcc aaccacaggg ttcccctcgg gatcaaagta ctttgatcca acccctccgc 7500
tgctatagtg cagtcggctt ctgacgttca gtgcagccgt catctgaaaa cgacatgtcg 7560
cacaagtcct aagttacgcg acaggctgcc gccctgccct tttcctggcg ttttcttgtc 7620
gcgtgtttta gtcgcataaa gtagaatact tgcgactaga accggagaca ttacgccatg 7680
aacaagagcg ccgccgctgg cctgctgggc tatgcccgcg tcagcaccga cgaccaggac 7740
ttgaccaacc aacgggccga actgcacgcg gccggctgca ccaagctgtt ttccgagaag 7800
atcaccggca ccaggcgcga ccgcccggag ctggccagga tgcttgacca cctacgccct 7860
ggcgacgttg tgacagtgac caggctagac cgcctggccc gcagcacccg cgacctactg 7920
gacattgccg agcgcatcca ggaggccggc gcgggcctgc gtagcctggc agagccgtgg 7980
gccgacacca ccacgccggc cggccgcatg gtgttgaccg tgttcgccgg cattgccgag 8040
ttcgagcgtt ccctaatcat cgaccgcacc cggagcgggc gcgaggccgc caaggcccga 8100
ggcgtgaagt ttggcccccg ccctaccctc accccggcac agatcgcgca cgcccgcgag 8160
ctgatcgacc aggaaggccg caccgtgaaa gaggcggctg cactgcttgg cgtgcatcgc 8220
tcgaccctgt accgcgcact tgagcgcagc gaggaagtga cgcccaccga ggccaggcgg 8280
cgcggtgcct tccgtgagga cgcattgacc gaggccgacg ccctggcggc cgccgagaat 8340
gaacgccaag aggaacaagc atgaaaccgc accaggacgg ccaggacgaa ccgtttttca 8400
ttaccgaaga gatcgaggcg gagatgatcg cggccgggta cgtgttcgag ccgcccgcgc 8460
acctctcaac cgtgcggctg catgaaatcc tggccggttt gtctgatgcc aagctggcgg 8520
cctggccggc cagcttggcc gctgaagaaa ccgagcgccg ccgtctaaaa aggtgatgtg 8580
tatttgagta aaacagcttg cgtcatgcgg tcgctgcgta tatgatccga tgagtaaata 8640
aacaaatacg caaggggaac gcatgaaggt tatcgctgta cttaaccaga aaggcgggtc 8700
aggcaagacg accatcggaa cccatctagc ccgcgccctg caactcgccg gggccgatgt 8760
tctgttagtc gattccgatc cccagggcag tgcccgcgat tgggcggccg tgcgggaaga 8820
tcaaccgcta accgttgtcg gcatcgaccg cccgacgatt gaccgcgacg tgaaggccat 8880
cggccggcgc gacttcgtag tgatcgacgg agcgccccag gcggcggact tggctgtgtc 8940
cgcgatcaag gcagccgact tcgtgctgat tccggtgcag ccaagccctt acgacatatg 9000
ggccaccgcc gacctggtgg agctggttaa gcagcgcatt gaggtcacgg atggaaggct 9060
acaagcggcc tttgtcgtgt cgcgggcgat caaaggcacg cgcatcggcg gtgaggttgc 9120
cgaggcgctg gccgggtacg agctgcccat tcttgagtcc cgtatcacgc agcgcgtgag 9180
ctacccaggc actgccgccg ccggcacaac cgttcttgaa tcagaacccg agggcgacgc 9240
tgcccgcgag gtccaggcgc tggccgctga aattaaatca aaactcattt gagttaatga 9300
ggtaaagaga aaatgagcaa aagcacaaac acgctaagtg ccggccgtcc gagcgcacgc 9360
agcagcaagg ctgcaacgtt ggccagcctg gcagacacgc cagccatgaa gcgggtcaac 9420
tttcagttgc cggcggagga tcacaccaag ctgaagatgt acgcggtacg ccaaggcaag 9480
accattaccg agctgctatc tgaatagatc gcgcagctac cagagtaaat gagcaaatga 9540
ataaatgagt agatgaattt tagcggctaa aggaggcggc atggaaaatc aagaacaacc 9600
aggcaccgac gccgtggaat gccccatgtg tggaggaacg ggcggttggc caggcgtaag 9660
cggctgggtt gtctgccggc cctgcaatgg cactggaacc cccaagcccg aggaatcggc 9720
gtgacggtcg caaaccatcc ggcccggtac aaatcggcgc ggcgctgggt gatgacctgg 9780
tggagaagtt gaaggccgcg caggccgccc agcggcaacg catcgaggca gaagcacgcc 9840
ccggtgaatc gtggcaagcg gccgctgatc gaatccgcaa agaatcccgg caaccgccgg 9900
cagccggtgc gccgtcgatt aggaagccgc ccaagggcga cgagcaacca gattttttcg 9960
ttccgatgct ctatgacgtg ggcacccgcg atagtcgcag catcatggac gtggccgttt 10020
tccgtctgtc gaagcgtgac cgacgagctg gcgaggtgat ccgctacgag cttccagacg 10080
ggcacgtaga ggtttccgca gggccggccg gcatggccag tgtgtgggat tacgacctgg 10140
tactgatggc ggtttcccat ctaaccgaat ccatgaaccg ataccgggaa gggaagggag 10200
acaagcccgg ccgcgtgttc cgtccacacg ttgcggacgt actcaagttc tgccggcgag 10260
ccgatggcgg aaagcagaaa gacgacctgg tagaaacctg cattcggtta aacaccacgc 10320
acgttgccat gcagcgtacg aagaaggcca agaacggccg cctggtgacg gtatccgagg 10380
gtgaagcctt gattagccgc tacaagatcg taaagagcga aaccgggcgg ccggagtaca 10440
tcgagatcga gctagctgat tggatgtacc gcgagatcac agaaggcaag aacccggacg 10500
tgctgacggt tcaccccgat tactttttga tcgatcccgg catcggccgt tttctctacc 10560
gcctggcacg ccgcgccgca ggcaaggcag aagccagatg gttgttcaag acgatctacg 10620
aacgcagtgg cagcgccgga gagttcaaga agttctgttt caccgtgcgc aagctgatcg 10680
ggtcaaatga cctgccggag tacgatttga aggaggaggc ggggcaggct ggcccgatcc 10740
tagtcatgcg ctaccgcaac ctgatcgagg gcgaagcatc cgccggttcc taatgtacgg 10800
agcagatgct agggcaaatt gccctagcag gggaaaaagg tcgaaaagga ctctttcctg 10860
tggatagcac gtacattggg aacccaaagc cgtacattgg gaaccggaac ccgtacattg 10920
ggaacccaaa gccgtacatt gggaaccggt cacacatgta agtgactgat ataaaagaga 10980
aaaaaggcga tttttccgcc taaaactctt taaaacttat taaaactctt aaaacccgcc 11040
tggcctgtgc ataactgtct ggccagcgca cagccgaaga gctgcaaaaa gcgcctaccc 11100
ttcggtcgct gcgctcccta cgccccgccg cttcgcgtcg gcctatcgcg gccgctggcc 11160
gctcaaaaat ggctggccta cggccaggca atctaccagg gcgcggacaa gccgcgccgt 11220
cgccactcga ccgccggcgc ccacatcaag gcaccctgcc tcgcgcgttt cggtgatgac 11280
ggtgaaaacc tctgacacat gcagctcccg gtgacggtca cagcttgtct gtaagcggat 11340
gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggcgca 11400
gccatgaccc agtcacgtag cgatagcgga gtgtatactg gcttaactat gcggcatcag 11460
agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga tgcgtaagga 11520
gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 11580
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 11640
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 11700
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 11760
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 11820
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 11880
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 11940
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 12000
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 12060
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 12120
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 12180
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 12240
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 12300
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 12360
actcacgtta agggattttg gtcatgcatt ctaggtgatt agaaaaactc atcgagcatc 12420
aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt 12480
ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat 12540
cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa 12600
ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa 12660
agtttatgca tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa 12720
tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag tcgaaatacg 12780
cgatcgctgt taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact 12840
gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct 12900
gttttccctg ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc 12960
ttgatggtcg gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta 13020
acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc 13080
ccatacaatc ggtagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac 13140
ccatataaat cagcatccat gttggaattt aatcgcggcc ttgagcaaga cgtttcccgt 13200
tgaatatggc tcataacaga acttattatt tccttcctct tttctacagt atttaaagat 13260
accccaagaa gctaattata acaagacgaa ctccaattca ctgttccttg cattctaaaa 13320
ccttaaatac cagaaaacag ctttttcaaa gttgttttca aagttggcgt ataacatagt 13380
atcgacggag ccgattttga aaccgcggtg atcacaggca gcaacgctct gtcatcgtta 13440
caatcaacat gctaccctcc gcgagatcat ccgtgtttca aacccggcag cttagttgcc 13500
gttcttccga atagcatcgg taacatgagc aaagtctgcc gccttacaac ggctctcccg 13560
ctgacgccgt cccggactga tgggctgcct gtatcgagtg gtgattttgt gccgagctgc 13620
cggtcgggga gctgttggct ggctggtggc aggatatatt gtggtgtaaa cataacgaat 13680
tcgtctca 13688
<210> 63
<211> 9902
<212> DNA
<213> 人工序列
<220>
<223> R2 质粒
<400> 63
ggagcaacct tattttgtac tttaaaaaat tcattttttt tattttttcg actttaaagc 60
caaaattatc ctttatttat gaaagtggat gtatttttat ccctttaata taaggttgag 120
ttttctttaa gtttgtaatg ttaagtgggg cactttatat tagtccaatt aacagaattg 180
acttagaaat tgatggcgat tacttgaaaa aatcgctaca aaaacataat aaaataaaat 240
ttcatttgat ttttaaacca aaagaaaagt gacatgacta acgatttgat cccatcttct 300
ttttttttta agaaaaaaat taaaagaaaa atttattaaa ctggatgatt aattttaaca 360
taaaaattaa aaaaataaaa atcaatcgag ctcactattt gatattatta ttttcatctt 420
gatattgtta cttcatatca ctgaattata aaatgcgtta acggcaatta tcatagacgc 480
agactgaaag cataaaatta caactattcc atttttgttt tttttttgcc aacccaaaaa 540
aaactaataa tttatttaca taattataga aaattggaat ttattcatgt ttttggacca 600
ttcagataac cccacaataa aaaaaaagtg cacaaaagtg caaagtgcta cgtgtcctaa 660
ttatagccat actacatttg tgcataaaat tagccaccat tatttttaag attattcttt 720
ttcttgtttt aatttatatg ccacactttc ttattaatcc atcttaaaca gaatgacaca 780
ctttttattt gacaaatatt taatgacatt attaacattt tatcctcgtt agatttcact 840
atgcggaata gagaatgtgt aaactttaaa cttcaaattt tggctccgca tacgactagc 900
gactatataa taataggaat tgagcacttg gcttttgtat atagcttcta tgtgtaccaa 960
aattagaaaa tcaggcgatt attataatct tgttgactaa atatagaatg catccattac 1020
ccccaaaaag tgtgattcca ctgtcatagg aggttttttt tatttcattt tatttgtgct 1080
ttcaataatg tagagtagtt ttacaaagat cctttctttg tgacacatgg taggtaatat 1140
tgctgatttt gttgtagttt tggggttata aagtttcaaa ttatttatac tggagggtag 1200
gggtgggggt tgtctataat gcaggttatg gttttacgtg aactcaataa ttattgtaga 1260
tactaagaaa tccactcagt gttcttgcgg tgtcttgctt ttgatttcag catcacttgt 1320
agttgattgt gtttagatta tcacattatt ctgtggctgt aactgtatcc ttgttagttg 1380
ctttgtttct acactgttgt tttccctctt ttatacctat tttgatatgt tgtactcgaa 1440
cgagggtcat cggggaacaa cctctttacc tccgtgaggt agagctatgg tctgtgtcca 1500
ctctaccctc cccagatccc tcttgtagga tttcactata ttgtaatatt aacttgaggt 1560
cactatagga gctcaaaaac ttctaatttt gaatcaatgt ctggttatac tttttttgtc 1620
ataactgtat ctcaaatgtg gtgtttggtt tatctcattt tgcagaagtc aagaaacagg 1680
ttactcctgt ttgagtgagg aaaagttggt ttgcctgtct gtggtctttt tataatcttt 1740
ttctacagaa gagaaagtgg gtaattttgt ttgagagtgg aaatattctc tagtgggaat 1800
ctactaggag taatttattt tctataaact aagtaaagtt tggaaggtga caaaaagaaa 1860
gacaaaaatc ttggaattgt tttagacaac caaggttttc ttgctcagaa tgtctgttgc 1920
cttgttatgg gttgtttctc cttgtgacgt ctcaaatggg acaagtttca tggaatcagt 1980
ccgggaggga aaccgttttt ttgattcatc gaggcatagg aatttggtgt ccaatgagag 2040
aatcaataga ggtggtggaa agcaaactaa taatggacgg aaattttctg tacggtctgc 2100
tattttggct actccatctg gagaacggac gatgacatcg gaacagatgg tctatgatgt 2160
ggttttgagg caggcagcct tggtgaagag gcaactgaga tctaccaatg agttagaagt 2220
gaagccggat atacctattc cggggaattt gggcttgttg agtgaagcat atgataggtg 2280
tggtgaagta tgtgcagagt atgcaaagac gtttaactta ggttagcttc ttcaatctat 2340
tcattcgttt accaaatatt atttggtaag cactaattat gaatatatat atgttcatgt 2400
tattgatgaa gacaaaattt gatctttgtt tgtttattca ggaactatgc taatgactcc 2460
cgagagaaga agggctatct aggcaatata tggtgaggtt tctagccatt taataacagt 2520
tacgcgcaca aacacatatg attaatcggg gacgagaaaa aaagaaatga agtttgagtt 2580
ttgagggtca tatgtaatag gtaaatccga gcttgactag cttgagatgt ttattgtcat 2640
atcatgctca atactaacca aaacactgaa aaagaacttg attatattta catactaata 2700
ttttcatttg cgttgctgtt cacattttta cctatggaac tggtttttgt gatttgttat 2760
acttcatatt cgatgttaat aaaatatatc attcctccct ttttctccac ttcaagcttt 2820
actgtagtgt tgaaagggga aactcctttt aatgattgca tatataaacg aacttcttga 2880
gttgaatagt ttctcattat gatctgttta aacagtatgg tgcagaagaa cagatgaact 2940
tgttgatggc ccaaacgcat catatattac cccggcagcc ttagataggt gggaaaatag 3000
gctagaagat gttttcaatg ggcggccatt tgacatgctc gatggtgctt tgtccgatac 3060
agtttctaac tttccagttg atattcaggt tagtctacca attctatggt ctttatattt 3120
gttcaatttg cgtttgatgt cacttttgct gagggctttt ctaatagctt acttcagcct 3180
agcggaaatg tttgtagttg aatctctagt tctgtctcct atatctgttt ctctcgtcct 3240
agatactaca catacttcat ttctgtttta acattttatt cgtcttttgg tgttgttttg 3300
tatgtgaatc atatatttgg aacagaatca ttattagttc acatgatttc atttgctttc 3360
ttcaatagcg taattgtcta accttccaat atatgttgca gccattcaga gatatgattg 3420
aaggaatgcg tatggacttg agaaaatcga gatacaaaaa cttcgacgaa ctataccttt 3480
attgttatta tgttgctggt acggttgggt tgatgagtgt tccaattatg gcgctgtcat 3540
gagacgaatt ctgacaggat atattggcgg gtaaacctaa gagaaaagag cgtttattag 3600
aataatcgga tatttaaaag ggcgtgaaaa ggtttatccg ttcgtccatt tgtatgtgca 3660
tgccaaccac agggttcccc tcgggatcaa agtactttga tccaacccct ccgctgctat 3720
agtgcagtcg gcttctgacg ttcagtgcag ccgtcatctg aaaacgacat gtcgcacaag 3780
tcctaagtta cgcgacaggc tgccgccctg cccttttcct ggcgttttct tgtcgcgtgt 3840
tttagtcgca taaagtagaa tacttgcgac tagaaccgga gacattacgc catgaacaag 3900
agcgccgccg ctggcctgct gggctatgcc cgcgtcagca ccgacgacca ggacttgacc 3960
aaccaacggg ccgaactgca cgcggccggc tgcaccaagc tgttttccga gaagatcacc 4020
ggcaccaggc gcgaccgccc ggagctggcc aggatgcttg accacctacg ccctggcgac 4080
gttgtgacag tgaccaggct agaccgcctg gcccgcagca cccgcgacct actggacatt 4140
gccgagcgca tccaggaggc cggcgcgggc ctgcgtagcc tggcagagcc gtgggccgac 4200
accaccacgc cggccggccg catggtgttg accgtgttcg ccggcattgc cgagttcgag 4260
cgttccctaa tcatcgaccg cacccggagc gggcgcgagg ccgccaaggc ccgaggcgtg 4320
aagtttggcc cccgccctac cctcaccccg gcacagatcg cgcacgcccg cgagctgatc 4380
gaccaggaag gccgcaccgt gaaagaggcg gctgcactgc ttggcgtgca tcgctcgacc 4440
ctgtaccgcg cacttgagcg cagcgaggaa gtgacgccca ccgaggccag gcggcgcggt 4500
gccttccgtg aggacgcatt gaccgaggcc gacgccctgg cggccgccga gaatgaacgc 4560
caagaggaac aagcatgaaa ccgcaccagg acggccagga cgaaccgttt ttcattaccg 4620
aagagatcga ggcggagatg atcgcggccg ggtacgtgtt cgagccgccc gcgcacctct 4680
caaccgtgcg gctgcatgaa atcctggccg gtttgtctga tgccaagctg gcggcctggc 4740
cggccagctt ggccgctgaa gaaaccgagc gccgccgtct aaaaaggtga tgtgtatttg 4800
agtaaaacag cttgcgtcat gcggtcgctg cgtatatgat ccgatgagta aataaacaaa 4860
tacgcaaggg gaacgcatga aggttatcgc tgtacttaac cagaaaggcg ggtcaggcaa 4920
gacgaccatc ggaacccatc tagcccgcgc cctgcaactc gccggggccg atgttctgtt 4980
agtcgattcc gatccccagg gcagtgcccg cgattgggcg gccgtgcggg aagatcaacc 5040
gctaaccgtt gtcggcatcg accgcccgac gattgaccgc gacgtgaagg ccatcggccg 5100
gcgcgacttc gtagtgatcg acggagcgcc ccaggcggcg gacttggctg tgtccgcgat 5160
caaggcagcc gacttcgtgc tgattccggt gcagccaagc ccttacgaca tatgggccac 5220
cgccgacctg gtggagctgg ttaagcagcg cattgaggtc acggatggaa ggctacaagc 5280
ggcctttgtc gtgtcgcggg cgatcaaagg cacgcgcatc ggcggtgagg ttgccgaggc 5340
gctggccggg tacgagctgc ccattcttga gtcccgtatc acgcagcgcg tgagctaccc 5400
aggcactgcc gccgccggca caaccgttct tgaatcagaa cccgagggcg acgctgcccg 5460
cgaggtccag gcgctggccg ctgaaattaa atcaaaactc atttgagtta atgaggtaaa 5520
gagaaaatga gcaaaagcac aaacacgcta agtgccggcc gtccgagcgc acgcagcagc 5580
aaggctgcaa cgttggccag cctggcagac acgccagcca tgaagcgggt caactttcag 5640
ttgccggcgg aggatcacac caagctgaag atgtacgcgg tacgccaagg caagaccatt 5700
accgagctgc tatctgaata gatcgcgcag ctaccagagt aaatgagcaa atgaataaat 5760
gagtagatga attttagcgg ctaaaggagg cggcatggaa aatcaagaac aaccaggcac 5820
cgacgccgtg gaatgcccca tgtgtggagg aacgggcggt tggccaggcg taagcggctg 5880
ggttgtctgc cggccctgca atggcactgg aacccccaag cccgaggaat cggcgtgacg 5940
gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct gggtgatgac ctggtggaga 6000
agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga ggcagaagca cgccccggtg 6060
aatcgtggca agcggccgct gatcgaatcc gcaaagaatc ccggcaaccg ccggcagccg 6120
gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca accagatttt ttcgttccga 6180
tgctctatga cgtgggcacc cgcgatagtc gcagcatcat ggacgtggcc gttttccgtc 6240
tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta cgagcttcca gacgggcacg 6300
tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg ggattacgac ctggtactga 6360
tggcggtttc ccatctaacc gaatccatga accgataccg ggaagggaag ggagacaagc 6420
ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa gttctgccgg cgagccgatg 6480
gcggaaagca gaaagacgac ctggtagaaa cctgcattcg gttaaacacc acgcacgttg 6540
ccatgcagcg tacgaagaag gccaagaacg gccgcctggt gacggtatcc gagggtgaag 6600
ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg gcggccggag tacatcgaga 6660
tcgagctagc tgattggatg taccgcgaga tcacagaagg caagaacccg gacgtgctga 6720
cggttcaccc cgattacttt ttgatcgatc ccggcatcgg ccgttttctc taccgcctgg 6780
cacgccgcgc cgcaggcaag gcagaagcca gatggttgtt caagacgatc tacgaacgca 6840
gtggcagcgc cggagagttc aagaagttct gtttcaccgt gcgcaagctg atcgggtcaa 6900
atgacctgcc ggagtacgat ttgaaggagg aggcggggca ggctggcccg atcctagtca 6960
tgcgctaccg caacctgatc gagggcgaag catccgccgg ttcctaatgt acggagcaga 7020
tgctagggca aattgcccta gcaggggaaa aaggtcgaaa aggactcttt cctgtggata 7080
gcacgtacat tgggaaccca aagccgtaca ttgggaaccg gaacccgtac attgggaacc 7140
caaagccgta cattgggaac cggtcacaca tgtaagtgac tgatataaaa gagaaaaaag 7200
gcgatttttc cgcctaaaac tctttaaaac ttattaaaac tcttaaaacc cgcctggcct 7260
gtgcataact gtctggccag cgcacagccg aagagctgca aaaagcgcct acccttcggt 7320
cgctgcgctc cctacgcccc gccgcttcgc gtcggcctat cgcggccgct ggccgctcaa 7380
aaatggctgg cctacggcca ggcaatctac cagggcgcgg acaagccgcg ccgtcgccac 7440
tcgaccgccg gcgcccacat caaggcaccc tgcctcgcgc gtttcggtga tgacggtgaa 7500
aacctctgac acatgcagct cccggtgacg gtcacagctt gtctgtaagc ggatgccggg 7560
agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg 7620
acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca tcagagcaga 7680
ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat 7740
accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 7800
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 7860
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 7920
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 7980
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 8040
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 8100
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 8160
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 8220
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 8280
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 8340
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 8400
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 8460
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 8520
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 8580
gttaagggat tttggtcatg cattctaggt gattagaaaa actcatcgag catcaaatga 8640
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 8700
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 8760
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 8820
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta 8880
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 8940
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagtcgaaa tacgcgatcg 9000
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 9060
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 9120
cctgggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 9180
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 9240
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 9300
aatcggtaga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 9360
aaatcagcat ccatgttgga atttaatcgc ggccttgagc aagacgtttc ccgttgaata 9420
tggctcataa cagaacttat tatttccttc ctcttttcta cagtatttaa agatacccca 9480
agaagctaat tataacaaga cgaactccaa ttcactgttc cttgcattct aaaaccttaa 9540
ataccagaaa acagcttttt caaagttgtt ttcaaagttg gcgtataaca tagtatcgac 9600
ggagccgatt ttgaaaccgc ggtgatcaca ggcagcaacg ctctgtcatc gttacaatca 9660
acatgctacc ctccgcgaga tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt 9720
ccgaatagca tcggtaacat gagcaaagtc tgccgcctta caacggctct cccgctgacg 9780
ccgtcccgga ctgatgggct gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg 9840
gggagctgtt ggctggctgg tggcaggata tattgtggtg taaacataac gaattcgtct 9900
ca 9902
<210> 64
<211> 1347
<212> DNA
<213> 人工序列
<220>
<223> CaMV35S
<400> 64
ctcgacgaat taattccaat cccacaaaaa tctgagctta acagcacagt tgctcctctc 60
agagcagaat cgggtattca acaccctcat atcaactact acgttgtgta taacggtcca 120
catgccggta tatacgatga ctggggttgt acaaaggcgg caacaaacgg cgttcccgga 180
gttgcacaca agaaatttgc cactattaca gaggcaagag cagcagctga cgcgtacaca 240
acaagtcagc aaacagacag gttgaacttc atccccaaag gagaagctca actcaagccc 300
aagagctttg ctaaggccct aacaagccca ccaaagcaaa aagcccactg gctcacgcta 360
ggaaccaaaa ggcccagcag tgatccagcc ccaaaagaga tctcctttgc cccggagatt 420
acaatggacg atttcctcta tctttacgat ctaggaagga agttcgaagg tgaaggtgac 480
gacactatgt tcaccactga taatgagaag gttagcctct tcaatttcag aaagaatgct 540
gacccacaga tggttagaga ggcctacgca gcaggtctca tcaagacgat ctacccgagt 600
aacaatctcc aggagatcaa ataccttccc aagaaggtta aagatgcagt caaaagattc 660
aggactaatt gcatcaagaa cacagagaaa gacatatttc tcaagatcag aagtactatt 720
ccagtatgga cgattcaagg cttgcttcat aaaccaaggc aagtaataga gattggagtc 780
tctaaaaagg tagttcctac tgaatctaag gccatgcatg gagtctaaga ttcaaatcga 840
ggatctaaca gaactcgccg tgaagactgg cgaacagttc atacagagtc ttttacgact 900
caatgacaag aagaaaatct tcgtcaacat ggtggagcac gacactctgg tctactccaa 960
aaatgtcaaa gatacagtct cagaagacca aagggctatt gagacttttc aacaaaggat 1020
aatttcggga aacctcctcg gattccattg cccagctatc tgtcacttca tcgaaaggac 1080
agtagaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa aggctatcat 1140
tcaagatctc tctgccgaca gtggtcccaa agatggaccc ccacccacga ggagcatcgt 1200
ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg acatctccac 1260
tgacgtaagg gatgacgcac aatcccacta tccttcgcaa gacccttcct ctatataagg 1320
aagttcattt catttggaga ggacacg 1347
<210> 65
<211> 4224
<212> DNA
<213> 人工序列
<220>
<223> atCas9
<400> 65
atggatcccc gggatcatct acttctgaag actcagactc agactaagca ggtgacgaac 60
gtcaccaatc ccaattcgat ctacatcgat aagaagtact ctatcggact cgatatcgga 120
actaactctg tgggatgggc tgtgatcacc gatgagtaca aggtgccatc taagaagttc 180
aaggttctcg gaaacaccga taggcactct atcaagaaaa accttatcgg tgctctcctc 240
ttcgattctg gtgaaactgc tgaggctacc agactcaaga gaaccgctag aagaaggtac 300
accagaagaa agaacaggat ctgctacctc caagagatct tctctaacga gatggctaaa 360
gtggatgatt cattcttcca caggctcgaa gagtcattcc tcgtggaaga agataagaag 420
cacgagaggc accctatctt cggaaacatc gttgatgagg tggcatacca cgagaagtac 480
cctactatct accacctcag aaagaagctc gttgattcta ctgataaggc tgatctcagg 540
ctcatctacc tcgctctcgc tcacatgatc aagttcagag gacacttcct catcgagggt 600
gatctcaacc ctgataactc tgatgtggat aagttgttca tccagctcgt gcagacctac 660
aaccagcttt tcgaagagaa ccctatcaac gcttcaggtg tggatgctaa ggctatcctc 720
tctgctaggc tctctaagtc aagaaggctt gagaacctca ttgctcagct ccctggtgag 780
aagaagaacg gacttttcgg aaacttgatc gctctctctc tcggactcac ccctaacttc 840
aagtctaact tcgatctcgc tgaggatgca aagctccagc tctcaaagga tacctacgat 900
gatgatctcg ataacctcct cgctcagatc ggagatcagt acgctgattt gttcctcgct 960
gctaagaacc tctctgatgc tatcctcctc agtgatatcc tcagagtgaa caccgagatc 1020
accaaggctc cactctcagc ttctatgatc aagagatacg atgagcacca ccaggatctc 1080
acacttctca aggctcttgt tagacagcag ctcccagaga agtacaaaga gattttcttc 1140
gatcagtcta agaacggata cgctggttac atcgatggtg gtgcatctca agaagagttc 1200
tacaagttca tcaagcctat cctcgagaag atggatggaa ccgaggaact cctcgtgaag 1260
ctcaatagag aggatcttct cagaaagcag aggaccttcg ataacggatc tatccctcat 1320
cagatccacc tcggagagtt gcacgctatc cttagaaggc aagaggattt ctacccattc 1380
ctcaaggata acagggaaaa gattgagaag attctcacct tcagaatccc ttactacgtg 1440
ggacctctcg ctagaggaaa ctcaagattc gcttggatga ccagaaagtc tgaggaaacc 1500
atcacccctt ggaacttcga agaggtggtg gataagggtg ctagtgctca gtctttcatc 1560
gagaggatga ccaacttcga taagaacctt ccaaacgaga aggtgctccc taagcactct 1620
ttgctctacg agtacttcac cgtgtacaac gagttgacca aggttaagta cgtgaccgag 1680
ggaatgagga agcctgcttt tttgtcaggt gagcaaaaga aggctatcgt tgatctcttg 1740
ttcaagacca acagaaaggt gaccgtgaag cagctcaaag aggattactt caagaaaatc 1800
gagtgcttcg attcagttga gatttctggt gttgaggata ggttcaacgc atctctcgga 1860
acctaccacg atctcctcaa gatcattaag gataaggatt tcttggataa cgaggaaaac 1920
gaggatatct tggaggatat cgttcttacc ctcaccctct ttgaagatag agagatgatt 1980
gaagaaaggc tcaagaccta cgctcatctc ttcgatgata aggtgatgaa gcagttgaag 2040
agaagaagat acactggttg gggaaggctc tcaagaaagc tcattaacgg aatcagggat 2100
aagcagtctg gaaagacaat ccttgatttc ctcaagtctg atggattcgc taacagaaac 2160
ttcatgcagc tcatccacga tgattctctc acctttaaag aggatatcca gaaggctcag 2220
gtttcaggac agggtgatag tctccatgag catatcgcta acctcgctgg atctcctgca 2280
atcaagaagg gaatcctcca gactgtgaag gttgtggatg agttggtgaa ggtgatggga 2340
aggcataagc ctgagaacat cgtgatcgaa atggctagag agaaccagac cactcagaag 2400
ggacagaaga actctaggga aaggatgaag aggatcgagg aaggtatcaa agagcttgga 2460
tctcagatcc tcaaagagca ccctgttgag aacactcagc tccagaatga gaagctctac 2520
ctctactacc tccagaacgg aagggatatg tatgtggatc aagagttgga tatcaacagg 2580
ctctctgatt acgatgttga tcatatcgtg ccacagtcat tcttgaagga tgattctatc 2640
gataacaagg tgctcaccag gtctgataag aacaggggta agagtgataa cgtgccaagt 2700
gaagaggttg tgaagaaaat gaagaactat tggaggcagc tcctcaacgc taagctcatc 2760
actcagagaa agttcgataa cttgactaag gctgagaggg gaggactctc tgaattggat 2820
aaggcaggat tcatcaagag gcagcttgtg gaaaccaggc agatcactaa gcacgttgca 2880
cagatcctcg attctaggat gaacaccaag tacgatgaga acgataagtt gatcagggaa 2940
gtgaaggtta tcaccctcaa gtcaaagctc gtgtctgatt tcagaaagga tttccaattc 3000
tacaaggtga gggaaatcaa caactaccac cacgctcacg atgcttacct taacgctgtt 3060
gttggaaccg ctctcatcaa gaagtatcct aagctcgagt cagagttcgt gtacggtgat 3120
tacaaggtgt acgatgtgag gaagatgatc gctaagtctg agcaagagat cggaaaggct 3180
accgctaagt atttcttcta ctctaacatc atgaatttct tcaagaccga gattaccctc 3240
gctaacggtg agatcagaaa gaggccactc atcgagacaa acggtgaaac aggtgagatc 3300
gtgtgggata agggaaggga tttcgctacc gttagaaagg tgctctctat gccacaggtg 3360
aacatcgtta agaaaaccga ggtgcagacc ggtggattct ctaaagagtc tatcctccct 3420
aagaggaact ctgataagct cattgctagg aagaaggatt gggaccctaa gaaatacggt 3480
ggtttcgatt ctcctaccgt ggcttactct gttctcgttg tggctaaggt tgagaaggga 3540
aagagtaaga agctcaagtc tgttaaggaa cttctcggaa tcactatcat ggaaaggtca 3600
tctttcgaga agaacccaat cgatttcctc gaggctaagg gatacaaaga ggttaagaag 3660
gatctcatca tcaagctccc aaagtactca ctcttcgaac tcgagaacgg tagaaagagg 3720
atgctcgctt ctgctggtga gcttcaaaag ggaaacgagc ttgctctccc atctaagtac 3780
gttaactttc tttacctcgc ttctcactac gagaagttga agggatctcc agaagataac 3840
gagcagaagc aacttttcgt tgagcagcac aagcactact tggatgagat catcgagcag 3900
atctctgagt tctctaaaag ggtgatcctc gctgatgcaa acctcgataa ggtgttgtct 3960
gcttacaaca agcacagaga taagcctatc agggaacagg cagagaacat catccatctc 4020
ttcaccctta ccaacctcgg tgctcctgct gctttcaagt acttcgatac aaccatcgat 4080
aggaagagat acacctctac caaagaagtg ctcgatgcta ccctcatcca tcagtctatc 4140
actggactct acgagactag gatcgatctc tcacagctcg gtggtgattc aagggctgat 4200
cctaagaaga agaggaaggt ttga 4224
<210> 66
<211> 771
<212> DNA
<213> 人工序列
<220>
<223> OCS 终止子
<400> 66
gtcctgcttt aatgagatat gcgagacgcc tatgatcgca tgatatttgc tttcaattct 60
gttgtgcacg ttgtaaaaaa cctgagcatg tgtagctcag atccttaccg ccggtttcgg 120
ttcattctaa tgaatatatc acccgttact atcgtatttt tatgaataat attctccgtt 180
caatttactg attgtaccct actacttata tgtacaatat taaaatgaaa acaatatatt 240
gtgctgaata ggtttatagc gacatctatg atagagcgcc acaataacaa acaattgcgt 300
tttattatta caaatccaat tttaaaaaaa gcggcagaac cggtcaaacc taaaagactg 360
attacataaa tcttattcaa atttcaaaag gccccagggg ctagtatcta cgacacaccg 420
agcggcgaac taataacgtt cactgaaggg aactccggtt ccccgccggc gcgcatgggt 480
gagattcctt gaagttgagt attggccgtc cgctctaccg aaagttacgg gcaccattca 540
acccggtcca gcacggcggc cgggtaaccg acttgctgcc ccgagaatta tgcagcattt 600
ttttggtgta tgtgggcccc aaatgaagtg caggtcaaac cttgacagtg acgacaaatc 660
gttgggcggg tccagggcga attttgcgac aacatgtcga ggctcagcag gacctgcagg 720
catgcaagct agcttactag tgatgcatat tctatagtgt cacctaaatc t 771
<210> 67
<211> 387
<212> DNA
<213> 人工序列
<220>
<223> U6-26 启动子
<400> 67
ctttttttct tcttcttcgt tcatacagtt tttttttgtt tatcagctta cattttcttg 60
aaccgtagct ttcgttttct tctttttaac tttccattcg gagtttttgt atcttgtttc 120
atagtttgtc ccaggattag aatgattagg catcgaacct tcaagaattt gattgaataa 180
aacatcttca ttcttaagat atgaagataa tcttcaaaag gcccctggga atctgaaaga 240
agagaagcag gcccatttat atgggaaaga acaatagtat ttcttatata ggcccattta 300
agttgaaaac aatcttcaaa agtcccacat cgcttagata agaaaacgaa gctgagttta 360
tatacagcta gagtcgaagt agtgatt 387
<210> 68
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> Ps#1 gRNA
<400> 68
ggaatgtctg ttgccttgtt agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt tttt 104
<210> 69
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1228483
<400> 69
aactgctttg aatgtccata tgg 23
<210> 70
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1222177
<400> 70
gctggagaac cgccgtttaa cgg 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1261146
<400> 71
cgcttgaatg atgaccactg cgg 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1352616
<400> 72
atattgtttt tcatattttt tgg 23
<210> 73
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1352124
<400> 73
ccaaaaaaaa aaaatacagt cgt 23
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1854159
<400> 74
gtttccgcca ccaccgcctc cgg 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1843852
<400> 75
tctacaaagt cattgaaggt tgg 23
<210> 76
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1858597
<400> 76
agagttgatc tgtggctgtg gcgg 24
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 4684724
<400> 77
tgactgcagg tgagcttaca cgg 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1565357
<400> 78
ccttggaaat tttctcttcc caa 23
<210> 79
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 1559196
<400> 79
ccccgacatt taatgatgtt ttt 23
<210> 80
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 拟南芥染色体 3 - 4639826
<400> 80
agaagttcag aaagtcgccc agg 23

Claims (32)

1.一种在体细胞植物细胞中的同源染色体之间靶向DNA重组的方法,所述方法包括以下步骤:
(a)在所述植物细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含所述同源染色体上的多态性等位基因的预选的内源靶位点,其中在表达所述核酸酶系统时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA,在至少一个所述多态性等位基因的DNA中产生双链断裂;
(b)分析所述植物细胞的后代,或从所述植物细胞生长的植物组织,或从所述细胞生长的植物或其所述植物的后代,用于所述同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);
(c)选择其中发生了靶向同源重组的植物细胞、其植物组织、其植物、或其植物后代。
2.根据权利要求1所述的方法,其中所述核酸酶系统包括锌指核酸酶(ZFN)系统、转录激活因子样效应物核酸酶(TALEN)系统、或成簇的规律间隔短回文重复(CRISPR)/CRISPR相关蛋白(Cas)系统。
3.根据权利要求2所述的方法,其中所述核酸酶系统包括锌指核酸酶(ZFN),所述锌指核酸酶(ZFN)包含锌指DNA结合结构域和DNA核酸酶切割结构域,其中所述锌指DNA结合结构域在所述预选的内源靶位点内结合,从而靶向所述DNA核酸酶切割结构域以在所述预选的内源靶位点内切割所述DNA。
4.根据权利要求2所述的方法,其中所述核酸酶系统包括转录激活因子样效应物核酸酶(TALEN)系统,所述转录激活因子样效应物核酸酶系统包含TAL效应物DNA结合结构域和DNA切割结构域,其中所述TAL效应物DNA结合结构域在所述预选的内源靶位点内结合,从而靶向所述DNA切割结构域以在所述预选的内源靶位点内切割所述DNA。
5.根据权利要求2所述的方法,其中所述核酸酶系统包括CRISPR/Cas核酸酶系统,所述CRISPR/Cas核酸酶系统包含CRISPR相关内切核酸酶和gRNA分子,其中所述gRNA分子在所述预选的内源靶位点内结合,从而引导所述CRISPR相关内切核酸酶在所述预选的内源靶位点内切割DNA。
6.根据权利要求5所述的方法,其中所述CRISPR相关内切核酸酶(Cas核酸酶)选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、C2c1、CasX、NgAgo、Csf1、Csf2、Csf3和Csf4,其同源物或其修饰形式。
7.根据权利要求1所述的方法,其中所述体细胞植物细胞来源于在所述预选的位点具有多态性等位基因的现有杂交或杂合植物细胞。
8.根据权利要求7所述的方法,其中所述现有的杂交或杂合植物细胞来源于野生型植物。
9.根据权利要求7所述的方法,其中所述方法产生具有亲本性状的组合的包含所述预选的内源靶位点内的靶向同源重组的体细胞植物细胞,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,来自包含所述体细胞植物细胞的植物或其后代植物的果实,或来自包含所述体细胞植物细胞的植物或其后代植物的种子,或其任何组合,所述组合不存在于任一亲本中。
10.根据权利要求9所述的方法,其中所述亲本性状包括增加的抗旱性,增加的对害虫的抗性,增加的对病原体的抗性,改善的营养物含量,或改善的生长参数,或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状。
11.根据权利要求1所述的方法,其中所述体细胞植物细胞来源于来自两株植物杂交后代的细胞,其中所述亲本植物细胞各自包含与所述预选的位点处的所述配偶相比的多态性等位基因。
12.根据权利要求11所述的方法,其中所述方法产生具有亲本性状的组合的包含所述预选的内源靶位点内的靶向同源重组的体细胞植物细胞,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,来自包含所述体细胞植物细胞的植物或其后代植物的果实,或来自包含所述体细胞植物细胞的植物或其后代植物的种子,或其任何组合,所述组合不存在于任一亲本中。
13.根据权利要求12所述的方法,其中通过所述靶向同源重组而重组的所述亲本性状包括增加的抗旱性,增加的对害虫的抗性,增加的对病原体的抗性,改善的营养含量,或改善的生长参数,或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状。
14.根据权利要求11所述的方法,其中所述亲本体细胞植物细胞之一包含所述核酸酶系统,并且其中所述核酸酶系统的DNA裂解活性靶向存在于不包含所述核酸酶系统的另一亲本植物细胞中的多态性等位基因。
15.根据权利要求11所述的方法,其中所述亲本体细胞植物细胞之一包含Cas核酸酶,而所述亲本体细胞植物细胞中的另一个包含gRNA分子,其中所述gRNA分子结合在所述预选的内源靶位点内,从而引导所述Cas核酸酶切割所述预选的内源靶位点内的DNA。
16.根据权利要求1所述的方法,其中所述体细胞植物细胞包含来自两个多态亲本系之间杂交的植物后代的细胞,其产生杂交植物,其中所述亲本植物系各自包含所述预选的内源靶位点处的多态性等位基因,其中只有一条亲本系包含所述核酸酶系统。
17.根据权利要求16所述的方法,其中所述方法产生具有亲本性状的组合的包含所述预选的内源靶位点内的靶向同源重组的体细胞植物细胞,或包含所述体细胞植物细胞的植物组织,或包含所述体细胞植物细胞的植物或其后代植物,来自包含所述体细胞植物细胞的植物或其后代植物的果实,或来自包含所述体细胞植物细胞的植物或其后代植物的种子,或其任何组合,所述组合不存在于任一亲本中。
18.根据权利要求17所述的方法,其中所述亲本性状包括增加的抗旱性,增加的对害虫的抗性,增加的对病原体的抗性,改善的营养物含量,或改善的生长参数,或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状。
19.根据权利要求16所述的方法,其中所述核酸酶系统包含Cas核酸酶和gRNA分子,其中所述gRNA分子在所述预选的内源靶位点内结合,从而引导所述Cas核酸酶在所述预选的内源靶位点内切割DNA,并且其中所述核酸酶系统的所述DNA切割活性仅发生在野生型亲本植物细胞中存在的异源等位基因上。
20.根据权利要求1所述的方法,其中所述体细胞植物细胞包含在植物组织或整株植物中。
21.根据权利要求1所述的方法,其中所述预选的内源靶位点包括含有基因、基因的一部分、或基因的调节上游或下游序列、或其任意组合的DNA,并且其中所述基因的表达或缺乏影响生长,抗旱性,对害虫的抗性,对病原体的抗性或营养成分,或对植物细胞、植物组织、植物、果实或种子或其任何组合有益的任何其他性状。
22.根据权利要求1所述的方法,其中所述预选的内源性靶位点包含常染色质或异染色质的区域。
23.根据权利要求1所述的方法,其中所述表达包括组成型诱导表达、诱导性表达诱导、组织特异性表达诱导,或条件特异性表达诱导,或其任何组合。
24.根据权利要求1所述的方法,其中所述体细胞植物细胞包含原生质体。
25.根据权利要求1所述的方法,其中所述体细胞植物细胞包括作物植物细胞。
26.根据权利要求1所述的方法,其中分析所述植物包括分析所述植物或其后代的一部分,所述植物或其后代包含叶、茎、芽、果实、种子。
27.根据权利要求1所述的方法,其中步骤(d)的所述选择的后代包含F1、F2或F3代,或任何后续代,或回交1至3代,或任何后续回交代。
28.根据权利要求1所述的方法,其中所述方法产生在所述预选的内源靶位点处包含所述靶向同源重组的体细胞植物细胞,或在预选的内源靶位点处包含所述靶向同源重组的植物组织,或在预选的内源靶位点处包含所述靶向同源重组的植物或其后代植物,或来自在预选的内源靶位点处包含靶向同源重组的植物或其后代植物的果实,或来自在预选的内源靶位点处包含所述靶向同源重组的植物或其后代植物的种子,或其任何组合,与对照植物细胞、植物或其后代、果实或种子相比,所述细胞、组织、植物或其后代、果实或种子包含增加的抗旱性,增加的对害虫的抗性,增加的对病原体的抗性,改善的营养含量,改善的生长参数,或对植物细胞、植物组织、植物、果实或种子有益的任何其他性状,或其任何组合。
29.一种植物,其包含通过包括在杂交体细胞植物细胞中的同源染色体之间的靶向DNA重组的方法产生的有益性状或品质的组合,所述方法包括以下步骤:
(a)在所述植物细胞中表达核酸酶系统,其中所述表达核酸酶系统靶向包含同源染色体上的多态性等位基因的预选的内源靶位点,其中在所述核酸酶系统表达时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内被切割,其中所述核酸酶切割所述DNA从而在至少一个所述多态性等位基因的DNA中产生双链断裂;
(b)分析所述植物细胞的后代、或从所述植物细胞生长的植物组织、或从所述细胞生长的植物或其所述植物的后代,用于同源染色体之间的同源重组,其中所述同源重组包括交叉或基因转换(非交叉);
(c)选择其中发生靶向同源重组的植物细胞、其植物组织、其植物或其植物后代;
(d)繁殖所述植物细胞或其植物组织或其植物或其植物后代以产生包含所述靶向同源重组的植物,其中所述植物包含任一所述杂交体细胞起源的亲本植物中不存在的有益品质或性状的组合。
30.根据权利要求29所述的植物,其中所述预选的内源靶位点包含常染色质或异染色质的区域。
31.一种产生包含有益性状或品质组合的后代植物的方法,其中所述组合不存在于任一亲本植物中,所述方法包括:
(a)选择亲本植物,其中每个所述亲本包含至少一种有益性状,其中所述有益性状不相同,并且其中所述亲本对于一种所述至少有益的性状是多态性的;
(b)杂交所述亲本植物以建立杂交植物;
(c)从所述杂交植物中收集体细胞;
(d)在所述体细胞性细胞中表达核酸酶系统,其中所述表达的核酸酶系统靶向包含同源染色体上的多态性等位基因的预选的内源靶位点,其中在所述核酸酶系统表达时,至少一个所述多态性等位基因的DNA在所述预选的内源靶位点内切割,其中所述核酸酶切割DNA从而在至少一个所述多态性等位基因的DNA中产生双链断裂,其中在所述靶向预选的内源靶标处的同源交叉或基因转换(非交叉)位点导致表达或调节至少一种所述有益性状或品质的表达的DNA交换;
(e)分析所述植物细胞的后代、或从所述植物细胞生长的植物组织、或从所述细胞生长的植物或其所述植物的后代,用于所述交叉或基因转换(非交叉)事件,其中表达所述性状组合;
(f)选择其中表达所述性状组合的植物细胞、其植物组织、其植物或其植物后代;
(g)繁殖所述植物细胞、其植物组织、其植物,以产生包含所述有益性状或品质组合的后代植物。
32.根据权利要求31所述的方法,其中所述预选的内源性靶位点包含常染色质或异染色质的区域。
CN201880010638.XA 2017-01-11 2018-01-11 同源染色体之间的靶向重组及其用途 Pending CN110268064A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762444827P 2017-01-11 2017-01-11
US62/444,827 2017-01-11
PCT/IL2018/050040 WO2018131034A1 (en) 2017-01-11 2018-01-11 Targeted recombination between homologous chromosomes and uses thereof

Publications (1)

Publication Number Publication Date
CN110268064A true CN110268064A (zh) 2019-09-20

Family

ID=61017978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880010638.XA Pending CN110268064A (zh) 2017-01-11 2018-01-11 同源染色体之间的靶向重组及其用途

Country Status (7)

Country Link
US (1) US20210032645A1 (zh)
EP (1) EP3568484A1 (zh)
CN (1) CN110268064A (zh)
BR (1) BR112019014420A2 (zh)
CA (1) CA3049749A1 (zh)
IL (1) IL267951A (zh)
WO (1) WO2018131034A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109266593B (zh) * 2018-08-24 2021-08-24 华中农业大学 基于Ngpiwi蛋白介导的禽多杀性巴氏杆菌基因敲除菌株及其构建方法和应用
CN112226456B (zh) * 2019-06-28 2022-08-05 中国水稻研究所 一种实现染色体定点遗传重组的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103842511A (zh) * 2011-03-23 2014-06-04 先锋国际良种公司 产生复合转基因性状基因座的方法
US20140157452A1 (en) * 2011-05-02 2014-06-05 Board Of Regents Of The University Of Nebraska Plants with Useful Traits and Related Methods
US20140283166A1 (en) * 2013-03-15 2014-09-18 Monsanto Technology, Llc Creation and transmission of megaloci
CN105025701A (zh) * 2012-12-27 2015-11-04 凯津公司 去除植物中遗传连锁的方法
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
CN106029886A (zh) * 2013-12-19 2016-10-12 阿迈瑞斯公司 基因组整合的方法
WO2017034971A1 (en) * 2015-08-21 2017-03-02 Monsanto Technology Llc Enhanced recombination of genomic loci
WO2017222779A1 (en) * 2016-06-20 2017-12-28 Dow Agrosciences Llc Methodologies and compositions for creating targeted recombination and breaking linkage between traits

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2488668C (en) * 2002-06-06 2013-02-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Agriculture And Agri-Food Modifying the dna recombination potential in eukaryotes
EP2687605A1 (en) * 2012-07-19 2014-01-22 Biogemma Method for performing homologous recombination
WO2015131101A1 (en) * 2014-02-27 2015-09-03 Monsanto Technology Llc Compositions and methods for site directed genomic modification

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103842511A (zh) * 2011-03-23 2014-06-04 先锋国际良种公司 产生复合转基因性状基因座的方法
US20140157452A1 (en) * 2011-05-02 2014-06-05 Board Of Regents Of The University Of Nebraska Plants with Useful Traits and Related Methods
CN105025701A (zh) * 2012-12-27 2015-11-04 凯津公司 去除植物中遗传连锁的方法
US20140283166A1 (en) * 2013-03-15 2014-09-18 Monsanto Technology, Llc Creation and transmission of megaloci
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
CN106029886A (zh) * 2013-12-19 2016-10-12 阿迈瑞斯公司 基因组整合的方法
WO2017034971A1 (en) * 2015-08-21 2017-03-02 Monsanto Technology Llc Enhanced recombination of genomic loci
WO2017222779A1 (en) * 2016-06-20 2017-12-28 Dow Agrosciences Llc Methodologies and compositions for creating targeted recombination and breaking linkage between traits

Non-Patent Citations (15)

* Cited by examiner, † Cited by third party
Title
CHRISTOPHER BROOKS等: "Efficient Gene Editing in Tomato in the First Generation Using the Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-Associated9 System", 《SCIENTIFIC CORRESPONDENCE》 *
CHRISTOPHER BROOKS等: "Efficient Gene Editing in Tomato in the First Generation Using the Clustered Regularly Interspaced Short Palindromic Repeats/CRISPR-Associated9 System", 《SCIENTIFIC CORRESPONDENCE》, vol. 166, 15 September 2014 (2014-09-15), pages 1292 - 1297, XP055529788, DOI: 10.1104/pp.114.247577 *
MERU J. SADHU等: "CRISPR- directed mitotic recombination enables genetic mapping without crosses", SCIENCE, vol. 352, no. 6289, pages 1113, XP055640898, DOI: 10.1126/science.aaf5124 *
MERU J. SADHU等: "CRISPR-directed mitotic recombination enables genetic mapping without crosses", 《SCIENCE》 *
MERU J. SADHU等: "CRISPR-directed mitotic recombination enables genetic mapping without crosses", 《SCIENCE》, vol. 352, 27 May 2016 (2016-05-27), pages 1113 - 1117 *
NANCY PODEVIN等: "Site-directed nucleases: a paradigm shift in predictable, knowledge-based plant breeding", 《TRENDS IN BIOTECHNOLOGY》 *
NANCY PODEVIN等: "Site-directed nucleases: a paradigm shift in predictable, knowledge-based plant breeding", 《TRENDS IN BIOTECHNOLOGY》, vol. 31, no. 6, 30 June 2013 (2013-06-30), pages 375 - 383, XP028550365, DOI: 10.1016/j.tibtech.2013.03.004 *
SHDEMA FILLER HAYUT等: "Targeted recombination between homologous chromosomes for precise breeding in tomato", 《NATURE COMMUNICATIONS》 *
SHDEMA FILLER HAYUT等: "Targeted recombination between homologous chromosomes for precise breeding in tomato", 《NATURE COMMUNICATIONS》, vol. 8, 26 May 2017 (2017-05-26), pages 1 - 9 *
SIMON SCHIML等: "The CRISPR/Cas system can be used as nuclease for in planta gene targeting and as paired nickases for directed mutagenesis in Arabidopsis resulting in heritable progeny", 《THE PLANT JOURNAL》 *
SIMON SCHIML等: "The CRISPR/Cas system can be used as nuclease for in planta gene targeting and as paired nickases for directed mutagenesis in Arabidopsis resulting in heritable progeny", 《THE PLANT JOURNAL》, vol. 80, 18 October 2014 (2014-10-18), pages 1139 - 1150, XP055290201, DOI: 10.1111/tpj.12704 *
TOMÁŠ ČERMÁK等: "High-frequency, precise modification of the tomato genome", 《GENOME BIOLOGY》, vol. 16, no. 1, 6 November 2015 (2015-11-06), pages 1 - 14 *
苏燎原等主编: "医学放射生物学基础", 中国原子能出版社, pages: 41 - 42 *
谢科等: "基因组编辑技术在植物中的研究进展与应用前景", 《中国生物工程杂志》 *
谢科等: "基因组编辑技术在植物中的研究进展与应用前景", 《中国生物工程杂志》, vol. 33, no. 06, 15 June 2013 (2013-06-15), pages 99 - 104 *

Also Published As

Publication number Publication date
US20210032645A1 (en) 2021-02-04
WO2018131034A1 (en) 2018-07-19
EP3568484A1 (en) 2019-11-20
BR112019014420A2 (pt) 2020-04-28
CA3049749A1 (en) 2018-07-19
IL267951A (en) 2019-09-26
RU2019125162A3 (zh) 2021-02-12
RU2019125162A (ru) 2021-02-12

Similar Documents

Publication Publication Date Title
JP2021061868A (ja) 一過性遺伝子発現により植物を正確に改変するための方法
CN106947762B (zh) 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
US20200283744A1 (en) Application of crispr/cas12a gene editing system in gene editing of physcomitrella patens
CN108699560A (zh) 花期调控基因和相关载体及其应用
CN111961749B (zh) 检测番茄黄化曲叶病毒病抗病基因Ty-3和Ty-3a的KASP引物及其应用
CN110268064A (zh) 同源染色体之间的靶向重组及其用途
KR20230163460A (ko) 식물에서의 증가된 형질전환성 및 반수체 유도
Bernatzky et al. Marker-aided selection in a backcross breeding program for resistance to chestnut blight in the American chestnut
CN113604596A (zh) 检测黄瓜小西葫芦黄化花叶病毒病抗病基因zym的KASP引物及其应用
RU2802791C2 (ru) Направленная рекомбинация между гомологичными хромосомами и ее применения
CN113614227A (zh) 介导植物基因组稳定整合的丝氨酸重组酶
CN112375781B (zh) pC1300-MAS-Cas9基因编辑系统在84K杨树基因编辑中的应用
WO2015103386A1 (en) The use of transgenic plant for recovery of non-transgenic hybrids
CN112280799A (zh) 利用CRISPR/Cas9系统对橡胶草或蒲公英基因定点突变的方法
CN111961684B (zh) 通过抑制小麦中TaVQ5基因的表达提高小麦抗病性的方法
KR20190139756A (ko) 페튜니아 원형질체에서 CRISPR/Cas9 시스템을 이용한 플라보노이드 생합성 유전자 교정세포를 배양하여 형질교정 재분화체를 유도하는 방법
CN112852866B (zh) 利用线粒体基因编辑系统培育植物雄性不育系的方法
CN114245823A (zh) 非生物胁迫耐性植物和方法
CN111961126B (zh) TaVQ25基因在调控小麦对白粉病和纹枯病抗性中的应用
CN116926104A (zh) 一种核雄性不育保持系的转育方法
CN114410645B (zh) 一种通过基因编辑改良水稻稃尖和叶鞘颜色的方法及其专用sgRNA和载体
CN115058446A (zh) 大豆多基因编辑表达载体及其构建方法与应用
KR102482937B1 (ko) CRISPR/Cas9 리보핵산단백질 기반 현사시나무 유전자 교정용 조성물 및 이의 이용
EP0136573B1 (en) Novel double-stranded dna
CN114854787B (zh) 一种植物重组表达载体及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination