CN115209724A - 用于选择可遗传编辑的方法 - Google Patents

用于选择可遗传编辑的方法 Download PDF

Info

Publication number
CN115209724A
CN115209724A CN202180017067.4A CN202180017067A CN115209724A CN 115209724 A CN115209724 A CN 115209724A CN 202180017067 A CN202180017067 A CN 202180017067A CN 115209724 A CN115209724 A CN 115209724A
Authority
CN
China
Prior art keywords
plant
plants
sequence
amplicon
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180017067.4A
Other languages
English (en)
Inventor
L·赖默奎斯
张远记
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Technology LLC
Original Assignee
Monsanto Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Technology LLC filed Critical Monsanto Technology LLC
Publication of CN115209724A publication Critical patent/CN115209724A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Botany (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

报告的方法鉴定植物中的可遗传序列被传递给后代的可能性。将一个或多个基因组编辑引入植物细胞中,并且分析所得的植物的基因组DNA以确定所述一个或多个基因组编辑在样品中的频率。以大于参考截止值的数量存在的编辑被认为具有可遗传和能够被传递给后代的高可能性。以低量存在的编辑被认为具有被传递的低可能性。然后将含有可能可遗传的所期望的基因组编辑的植物用于栽培和繁殖。

Description

用于选择可遗传编辑的方法
相关申请的交叉引用
本申请要求2020年2月27日提交的美国临时申请号62/982,523的权益和优先权。上述申请的全部公开内容以引用的方式并入本文。
技术领域
本公开整体涉及用于选择可遗传编辑的方法,例如,在植物等中选择可遗传编辑的方法,具体而言,涉及用于预测编辑的遗传性以便选择可以传递给后代的那些编辑的方法。
背景技术
本部分提供涉及本公开的背景信息,这些背景信息不一定是现有技术。
基因组编辑工具可以用于在植物细胞的基因组中引入所期望的核苷酸变化(“编辑”)。一旦编辑得以进行,则通过有丝分裂从被编辑的细胞产生的所有细胞也将携带该编辑。只有当含有编辑的细胞是生殖系细胞时,编辑才会传递给后代(是“可遗传”或“可恢复”的)。例如,在植物生命后期发生在分离的叶细胞中的编辑不会被遗传,而在分生组织早期发生的编辑更有可能在整个植物包括生殖细胞中延续。因此,编辑的位置和时间会影响遗传的可能性。
基因组编辑有可能通过为植物提供所期望的农艺特征(如抗病性、抗旱性和提高产量)而改善农业。为了实现这些有益效果,基因组编辑必须是可遗传的。基因组编辑植物的繁殖是资源密集型的,占用有限的温室空间。当将具有不可遗传的体细胞编辑的植物传递给下一代时,这些宝贵的资源就会被浪费。所以,希望仅选择那些具有高可遗传编辑可能性的植物进行进一步繁殖。
发明内容
本部分提供了本公开的一般发明内容,并不是对其全部范围或其所有特征的全面公开。
本公开的示例性实施方案整体涉及鉴定可遗传序列在植物中的可能性的方法。示例性实施方案还整体涉及用于选择具有可遗传编辑的植物的方法。
这样,在一个示例性实施方案中,一种用于鉴定可遗传序列在植物中的可能性的方法包括从植物获得细胞;从所述植物提取和分离DNA;由所述DNA扩增靶序列;鉴定和定量所述扩增的靶序列内的插入和/或缺失;以及根据所述扩增的靶序列中的所述插入和/或缺失的数量来预测序列的遗传性,其中当所述扩增的靶序列的数量等于或大于参考截止值时,所述扩增的靶序列被确定为具有高遗传可能性,以及其中当所述扩增的靶序列的数量大于噪声截止值但小于所述参考截止值时,所述靶序列被确定为具有低遗传可能性。
在另一个示例性实施方案中,一种用于选择具有可遗传编辑的植物的方法包括从植物获得细胞;从所述植物提取和分离DNA;由所述DNA扩增靶序列;定量相对于从所述靶序列获得的所有读段而言特定的编辑的等位基因的读段数;选择其中特定的编辑的等位基因为来自所述靶序列的总读段为至少约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的植物。
若干实施方案涉及一种用于鉴定可遗传序列在植物中的可能性的方法,所述方法包括:使所述植物接触序列特异性编辑酶;从编辑的植物获得细胞;从所述植物提取和分离DNA;由所述DNA扩增靶序列;在扩增的靶序列库中鉴定和定量包含修饰的序列;以及根据在所述扩增的靶序列库中的所述修饰的序列的丰度来预测修饰的序列的遗传性;其中当所述修饰的序列的丰度等于或大于10%参考截止值时,所述修饰的序列被确定为具有高遗传可能性;其中当所述修饰的序列的丰度小于10%参考截止值时,所述修饰的序列被确定为具有低遗传可能性。在一些实施方案中,细胞从所述植物的两个或更多个部分获得。在一些实施方案中,从中获得所述细胞的所述植物的部分选自由叶、茎、根、分生组织和生殖系组成的组。在一些实施方案中,植物是玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一些实施方案中,方法采用片段长度分析。在一些实施方案中,方法采用桑格(Sanger)测序、鸟枪测序、片段长度分析(FLA)、单分子实时测序(PacBio)、离子激流测序、焦磷酸测序、边合成边测序(Illumina)、组合探针锚合成、边连接边测序(SOLiD测序)、纳米孔测序或GenapSys测序。在一些实施方案中,修饰的序列的丰度大于所述噪声截止值约四倍。在一些实施方案中,参考截止值选自约11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%。在一些实施方案中,选择和繁殖包含具有高遗传可能性的序列的植物。在一些实施方案中,方法采用扩增子测序。在一些实施方案中,方法采用短扩增子测序(SASi)或长扩增子测序(LASi)。
若干实施方案涉及一种用于鉴定可遗传序列在植物中的可能性的方法,所述方法包括:使所述植物接触序列特异性编辑酶;从编辑的植物获得细胞;从所述植物提取和分离DNA;由所述DNA扩增靶序列;在扩增的靶序列库中鉴定和定量包含修饰的序列;以及根据在所述扩增的靶序列库中的所述修饰的序列的丰度来预测修饰的序列的遗传性;其中当所述修饰的序列的丰度大于噪声截止值但小于倍数截止值时,所述修饰的序列被确定为具有低遗传可能性。在一些实施方案中,细胞从所述植物的两个或更多个部分获得。在一些实施方案中,从中获得所述细胞的所述植物的部分选自由叶、茎、根、分生组织和生殖系组成的组。在一些实施方案中,植物是玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一些实施方案中,方法采用片段长度分析。在一些实施方案中,修饰的序列的丰度大于所述噪声截止值约四倍。在一些实施方案中,参考截止值选自约11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%。在一些实施方案中,选择和繁殖包含可遗传序列的植物。在一些实施方案中,方法采用扩增子测序。在一些实施方案中,方法采用短扩增子测序(SASi)或长扩增子测序(LASi)。
若干实施方案涉及一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所选的编辑的等位基因的相对丰度;选择其中所选的编辑的等位基因的相对丰度为至少约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的R0植物。在一些实施方案中,繁殖所选的R0植物。在一些实施方案中,使所选的R0植物杂交。在一些实施方案中,使所选的R0植物自交。在一些实施方案中,R0植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一些实施方案中,R0植物使用片段长度分析来分析。在一些实施方案中,R0植物使用扩增子测序来分析。在一些实施方案中,R0植物使用短扩增子测序(SASi)或长扩增子测序(LASi)来分析。
若干实施方案涉及一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所述R0植物扩增子的FLA测定的所述噪声截止值;选择包含对应于所述噪声截止值的至少四倍的峰的编辑的等位基因的R0植物。在一些实施方案中,繁殖所选的R0植物。在一些实施方案中,使所选的R0植物杂交。在一些实施方案中,使所选的R0植物自交。在一些实施方案中,R0植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
若干实施方案涉及一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所述R0植物扩增子的FLA测定的所述倍数截止值;确定所述R0植物扩增子的FLA测定的所述噪声截止值;选择包含对应于小于或等于所述倍数截止值且大于所述噪声截止值的峰的编辑的等位基因的R0植物。在一些实施方案中,繁殖所选的R0植物。在一些实施方案中,使所选的R0植物杂交。在一些实施方案中,使所选的R0植物自交。在一些实施方案中,R0植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一些实施方案中,R0植物是二倍体。在一些实施方案中,R0植物是多倍体。在一些实施方案中,R0植物是四倍体。
若干实施方案涉及一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所述R0植物扩增子的FLA峰比率;选择包含对应于小于或等于1、1.25、2.5或5的峰的编辑的等位基因的R0植物。在一些实施方案中,繁殖所选的R0植物。在一些实施方案中,使所选的R0植物杂交。在一些实施方案中,使所选的R0植物自交。在一些实施方案中,R0植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一些实施方案中,R0植物是二倍体。在一些实施方案中,R0植物是多倍体。在一些实施方案中,R0植物是四倍体。
若干实施方案涉及一种用于确定R0植物的接合性的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所述靶位点处的所述等位基因的所述FLA峰比率;以及选择其中此类等位基因的所述FLA峰比率为至少约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的那些等位基因。
适用性的其他领域将从本文提供的描述中变得显而易见。本发明内容中的描述和具体实例仅用于说明目的,并不旨在限制本公开的范围。
附图说明
本文所述的附图仅用于说明所选的实施方案,而不是所有可能的实施方式的目的,并且不旨在限制本公开的范围。
图1是片段长度分析(FLA)测定的信噪比测定和倍数截止值的图示。噪声截止值以黑色楔形符号表示,并被设置为超过50%的测定植物具有一个假设噪声峰的高度的两倍。倍数截止值以白色楔形符号表示。倍数截止值通过测定扩增的1.25*等位基因数来计算。FLA峰比率小于或等于倍数截止值且大于噪声截止值的的峰被确定为具有高遗传可能性的编辑(1A)。FLA峰比率大于倍数截止值但大于噪声截止值的峰被认为是具有低遗传可能性的编辑(1B)。大于或等于(>=)80%的植物共有的并且不具有预期的野生型(WT)大小的峰(以“*”表示)可能是PCR伪影或基因家族成员的扩增,并且在噪声截止值和最大高度计算之前被删除(1C)。
图2是FLA峰比率与编辑的等位基因的观察遗传性之间的相关性的图示。
图3是通过FLA和扩增子测序读段确定的编辑的等位基因丰度的一致性的图示。
图4是显示编辑的等位基因的遗传性与编辑的等位基因的扩增子序列读段的百分比的关系的图示。
图5示意性地展示了通过Illumina(SASi)测序方案从配对(5A)和非配对(5B)短扩增子测序映射到参考序列(Ref)的读段。向导RNA靶位点以方框表示。
图6示意性地展示了通过Illumina(LASi)测序方案从长扩增子测序映射到参考序列的测序读段。向导RNA靶位点以方框表示。
图7展示了选择具有可遗传编辑的植物用于进一步繁殖和育种的示例性方法。
图8展示了单个编辑植物(样品)的编辑调用输出的实例。每个“:”表示与参考序列(WT)核苷酸具有同一性的核苷酸,每个“-”表示缺失;“u0”是观察到的WT,“S”表示在5'-3'取向上相对于gRNA靶位点的第一个碱基的编辑的相对位置,“d”是缺失。根据图7中描述的方法选择对应于样品1、3和5的植物用于进一步繁殖和育种。
图9展示了显示图8中描述的植物的接合性的调用结果的实例。
具体实施方式
现在将参考附图和实例在下文中描述本公开,其中示出了本公开的实施方案。该描述不旨在成为可以实施本公开的所有不同方式或者可以添加到本公开的所有特征的详细目录。例如,关于一个实施方案说明的特征可以结合到其他实施方案中,并且关于特定实施方案说明的特征可以从该实施方案中删除。因此,本公开设想,在本公开的一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。此外,根据本公开,对本文提出的各种实施方案的许多变化和添加对于本领域的技术人员将是显而易见的,这些变化和添加不脱离本公开。因此,以下描述旨在展示本公开的一些特定实施方案,而不是详尽地指定它们的所有排列、组合和变化。
除非另有定义,否则本文使用的所有技术和科学术语与本公开所属领域的普通技术人员的通常理解具有相同的含义。本文在本公开的描述中使用的术语仅出于描述特定实施方案的目的,并且不旨在限制本公开。除非另外指明,否则本公开中描述的实施方案的实践包括、利用本领域技术范围内的生物化学、化学、分子生物学、微生物学、细胞生物学、植物生物学、基因组学、生物技术和遗传学的常规技术。参见,例如,Green和Sambrook,Molecular Cloning:A Laboratory Manual,第4版(2012);Current Protocols InMolecular Biology(F.M.Ausubel等人编,(1987));Plant Breeding Methodology(N.F.Jensen,Wiley-Interscience(1988));the series Methods In Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames andG.R.Taylor eds.(1995));Harlow和Lane编,(1988)Antibodies,A Laboratory Manual;Animal Cell Culture(R.I.Freshney编,(1987));Recombinant Protein Purification:Principles And Methods,18-1142-75,GE Healthcare Life Sciences;C.N.Stewart,A.Touraev,V.Citovsky,T.Tzfira编(2011)Plant Transformation Technologies(Wiley-Blackwell);以及R.H.Smith(2013)Plant Tissue Culture:Techniques and Experiments(Academic Press,Inc.)。
本文引用的所有出版物、专利申请、专利和其他参考文献以引用的方式整体并入,以用于与其中提供参考文献的句子和/或段落相关的教导。如本文所用,术语“等位基因”是指占据染色体上的给定基因座的序列的若干替代形式之一。当存在于染色体上的给定基因座的所有等位基因相同时,该植物在该基因座是“纯合的”。如果存在于染色体上的给定基因座的等位基因不同,则该植物在该基因座是“杂合的”。
“扩增子”是扩增的核酸,例如通过任何可用的扩增方法(例如PCR、LCR、转录等等)扩增模板核酸而产生的核酸。
术语“基因组”不仅涵盖细胞核内存在的染色体DNA,还涵盖细胞的亚细胞组分(例如,线粒体或质体)内存在的细胞器DNA。
如本文所用,“基因组基因座”是指染色体上的遗传或物理位置。
如本文所用,术语“基因”包括表达功能分子的核酸片段,所述功能分子诸如但不限于特定的蛋白质编码序列和调控元件,所述调控元件诸如编码序列之前(5'非编码序列)和之后(3'非编码序列)的那些调控元件。
如本文所用,术语“基因组编辑”或“编辑”是指以位点特异性方式对核苷酸序列进行的任何修饰。在本公开中,基因组编辑技术包括使用核酸内切酶、重组酶、转座酶、解旋酶以及它们的任何组合。在一个方面,“修饰”包括胞苷或脱氧胞苷分别水解脱氨基为尿苷或脱氧尿苷。在一些实施方案中,序列特异性编辑系统包含腺嘌呤脱氨酶。在一个方面,“修饰”包括腺嘌呤或腺苷的水解脱氨基。在一个方面,“修饰”包括腺苷或脱氧腺苷分别水解脱氨基为肌苷或脱氧肌苷。在一个方面,“修饰”包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸的插入。在另一个方面,“修饰”包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸的缺失。在另一个方面,“修饰”包括至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸的倒位。在又一个方面,“修饰”包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸的置换。在又一个方面,“修饰”包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少25个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少750个、至少1000个、至少1500个、至少2000个、至少3000个、至少4000个、至少5000个或至少10,000个核苷酸的重复。在一些实施方案中,“修饰”包括核酸序列中的“A”置换为“C”、“G”或“T”。在一些实施方案中,“修饰”包括核酸序列中的“C”置换为“A”、“G”或“T”。在一些实施方案中,“修饰”包括核酸序列中的“G”置换为“A”、“C”或“T”。在一些实施方案中,“修饰”包括核酸序列中的“T”置换为“A”、“C”或“G”。在一些实施方案中,“修饰”包括核酸序列中的“C”置换为“U”。在一些实施方案中,“修饰”包括核酸序列中的“G”置换为“A”。在一些实施方案中,“修饰”包括核酸序列中的“A”置换为“G”。在一些实施方案中,“修饰”包括核酸序列中的“T”置换为“C”。
如本文所用,术语“植物”是指通常被理解为该术语的含义涵盖生物体。在一个实施方案中,植物是属于植物界的活生物体,并且包括乔木、灌木、矮灌木、草本、草、蕨类和苔藓。通常,虽然不是必需的,但是植物包括茎、叶、根、花、果实、种子、鳞茎或它们的任何组合。在一个实施方案中,植物包括由真核细胞组成的活生物体,所述真核细胞包括细胞壁、液泡以及/或者叶绿体或其他光合色素中的一者或多者。
如本文所用,术语“靶位点”或“靶序列”是指基因组编辑技术结合和/或发挥切割、切口酶、重组酶、脱氨酶或转座酶活性的核苷酸序列。靶位点可以是基因的或非基因的。靶位点可以在染色体、附加体、基因座或细胞的基因组中的任何其他DNA分子(包括染色体、叶绿体、线粒体DNA、质粒DNA)上。靶位点可以是细胞的基因组中的内源性位点,或者靶位点对于细胞可以是异源性的,因此并非天然存在于细胞的基因组中,或者与天然存在相比,靶位点可以存在于异源性基因组位置中。
若干编辑方法是本领域已知的,涉及不同的修饰基因组DNA的序列特异性基因组修饰酶(或者蛋白质和/或向导RNA的复合物)。在一些实施方案中,序列特异性基因组修饰酶通过在所期望的基因组位点或基因座(在本文中称为靶位点)处诱导双链断裂(DSB)或者一个或多个单链断裂(SSB)来修饰基因组。在一些实施方案中,序列特异性基因组修饰酶(诸如碱基编辑酶)引入修饰而不切割DNA。在一些实施方案中,在修复序列特异性基因组修饰酶引入的DSB或SSB的过程中,供体模板DNA可以在DSB或SSB的位点整合进基因组中。在一些实施方案中,在修复序列特异性基因组修饰酶引入的DSB或SSB的过程中,可以将插入或缺失突变(indel)引入基因组中。在其他实施方案中,DSB或多个SSB可以导致切除序列的倒位。在其他实施方案中,DSB或多个SSB可以导致核苷酸序列的重复。在一些实施方案中,在修复基因组修饰酶引入的DSB或SSB的过程中,可以将一个或多个核苷酸的置换引入基因组中。在一些实施方案中,序列特异性基因组修饰酶包括胞苷脱氨酶。在一些实施方案中,序列特异性基因组修饰酶包括腺嘌呤脱氨酶。在本公开中,序列特异性基因组修饰酶包括核酸内切酶、重组酶、转座酶、脱氨酶、解旋酶、逆转录酶以及它们的任何组合。
序列特异性基因组修饰酶(或者蛋白质和/或向导RNA的复合物)可以用于将一种或多种插入、缺失、置换、碱基修饰、易位或倒位引入宿主细胞的基因组中。在一些实施方案中,序列特异性基因组修饰酶(或者蛋白质和/或向导RNA的复合物)包含DNA结合结构域,诸如CRISPR-Cas效应子蛋白、锌指蛋白或转录活化因子(TAL)蛋白。在一些实施方案中,序列特异性DNA结合结构域可以是融合蛋白。在一些实施方案中,序列特异性基因组修饰酶可以包括但不限于RNA引导的核酸酶编辑系统,诸如CRISPR相关核酸酶(CRISPR相关核酸酶的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cas 12a(也称为Cpf1)、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、CasX、CasY、Mad7)和CRISPR阵列(CRISPR向导)核酸,当作为系统表达或引入细胞中时,RNA引导的核酸酶编辑系统可以以序列特异性方式修饰靶核酸。序列特异性基因组修饰酶的其他实例包括大范围核酸酶、锌指核酸酶(ZFN)和转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中,序列特异性基因组修饰酶可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),所述结构域可以来自例如多核苷酸引导的效应子蛋白(例如,Cas9、Cas12a)、锌指蛋白和/或转录激活因子样效应物蛋白(TALE),以及修饰DNA的效应子结构域。效应子结构域的实例包括切割结构域(例如,核酸酶),包括但不限于核酸内切酶(例如,Fok1)、脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5'瓣状核酸内切酶(FEN)。
在一些实施方案中,CRISPR相关核酸酶选自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统、或VI型CRISPR-Cas系统。CRISPR相关核酸酶需要另一种的非编码核苷酸组分(称为向导核酸)具有功能活性。本文提供的向导核酸分子可以是DNA、RNA或者DNA和RNA的组合。如本文所用,“向导RNA”或“gRNA”是指识别靶DNA序列并且将CRISPR效应子蛋白指导或“引导”至靶DNA序列的RNA。向导RNA由与靶DNA互补的区域(称为crRNA)和结合CRISPR效应子蛋白的区域(称为tracrRNA)组成。向导RNA可以是单个RNA分子(sgRNA)或两个单独的RNA分子(2片gRNA)。在一些实施方案中,gRNA可以另外包含用于逆转录酶的RNA模板(pegRNA)。CRISPR-Cas效应子蛋白的实例包括但不限于Cas9、C2c1、C2c3、C2c4、C2c5、C2c8、C2c9、C2c10、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3"、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、Csf5、Cas14a、Cas14b和Cas14c效应子蛋白。
序列特异性修饰酶可以用于将编辑引入植物的基因组中,以产生新的和有益的遗传变异。根据转化的方法以及在基因组中引入编辑的序列特异性修饰酶活性的时间,植物(R0)可以是嵌合的,一些细胞具有一个或多个编辑的等位基因,而另一些细胞则不具有编辑的等位基因(WT)。如本文所用,术语“编辑的等位基因”是指与参考序列相比在该基因座处包含一个或多个修饰的靶位点。R0植物中的编辑的等位基因的丰度受到修饰的时间(发育早期与晚期)以及进行编辑的组织的影响。例如,与在发育晚期进行的编辑相比,在发育早期进行的编辑将存在于植物的更多组织中。本文所述的方法可以用于评估任何特定编辑的等位基因是否可能是可遗传的。具有通过本文所述的方法确定的可遗传编辑的等位基因的R0植物可以被选择用于进一步繁殖和分析,而具有编辑的等位基因的R0植物(本文所述的方法将其确定为不太可能是可遗传的)可以被丢弃,从而节省资源。
本文提供的方法可以用于选择基因组中携带一个或多个编辑的等位基因的R0植物,用于使用本领域中的一种或多种已知方法进行子代的繁殖和进一步繁育,所述方法例如谱系育种、轮回选择、大规模选择和突变育种。通过本文提供的方法和系统选择的编辑可以渗入到不同的遗传背景中并且通过基因型或表型筛选来进行选择。
谱系育种开始于两种基因型的杂交,诸如第一种植物包含编辑的等位基因,另一种植物缺乏编辑的等位基因。如果两个原始亲本不提供所有所期望的特征,则可以将其他来源包括在繁育种群中。在谱系方法中,优良的植物自花授粉并且在连续子代中进行选择。在后续子代中,由于自花受精和选择,杂合条件被同质品种淘汰。另外,未选择的编辑,例如脱靶编辑,会丢失。通常,在谱系育种方法中,进行五轮或更多轮连续子代的自花授粉和选择:F1至F2;F2至F3;F3至F4;F4至F5等。在进行足够的近交后,连续子代将有助于增加已开发品种的种子。已开发品种可以在其基因座的约95%或更多处包含纯合的等位基因。
除用于产生回交转化之外,回交还可以与谱系育种组合使用。回交可以用于将一个或多个编辑的等位基因从供体亲本转移到已开发品种(称为轮回亲本),所述已开发品种具有总体良好的农艺特征,但是缺乏一个或多个所期望的性状。然而,相同的程序可以用于使后代朝向轮回亲本的基因型移动,但是同时通过在早期停止回交并且进行自花授粉和选择保留了非轮回亲本的很多组分。例如,第一植物品种可以与第二植物品种杂交以产生第一代子代植物。然后可以将第一代子代植物与其亲本品种之一回交以产生BC1或BC2。子代是自花授粉和选择的,因此新开发品种具有轮回亲本的很多属性和非轮回亲本的一些所期望的属性。这种方法采用轮回亲本的价值和优势用于新的植物品种。
通过本文提供的方法和系统鉴定和/或表征的编辑可以改善植物的农艺特征。如本文所用,术语“农艺特征”是指可以测量的任何农艺上重要的表型。农艺特征的非限制性实例包括花分生组织大小、花分生组织数量、穗分生组织大小、苗分生组织大小、根分生组织大小、雄穗大小、穗大小、绿度、产量、生长速率、生物量、成熟时鲜重、成熟时干重、成熟种子数、果实产量、种子产量、植物总含氮量、氮利用效率、抗倒伏性、株高、根深、根质量、种子含油量、种子含蛋白量、种子含游离氨基酸量、种子含碳水化合物量、种子含维生素量、种子发芽率、种子发芽速度、距成熟天数、耐旱性、耐盐性、耐热性、耐寒性、紫外线耐受性、二氧化碳耐受性、耐涝性、氮摄取、穗高、穗宽、穗直径、穗长、节间数、碳同化率、避荫性、耐荫性、所产生的花粉的质量、豆荚数、抗除草剂性、抗昆虫性和抗病性。
任何植物或植物细胞都可以与本文提供的方法和组合物一起使用。
在一个方面,植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。在一个方面,植物是被子植物。在一个方面,植物是裸子植物。在一个方面,植物是单子叶植物。在一个方面,植物是双子叶植物。在一个方面,植物是选自由以下组成的组的科的植物:葱科、漆树科、伞形科、槟榔科、菊科、十字花科、槐科、葫芦科、杜鹃花科、豆科、胡桃科、锦葵科、含羞草科、桑科、芭蕉科、兰科、蝶形科、松科、禾本科、蔷薇科、芸香科、茜草科和茄科。
在一个方面,植物细胞选自由以下组成的组:玉米细胞、水稻细胞、高粱细胞、小麦细胞、苜蓿细胞、大麦细胞、小米细胞、黑麦细胞、甘蔗细胞、棉花细胞、大豆细胞、芸苔细胞、番茄细胞、洋葱细胞、胡椒细胞、黄瓜细胞、拟南芥细胞、小米细胞、豆类细胞、黑莓细胞、西兰花细胞、卷心菜细胞、胡萝卜细胞、花椰菜细胞、茴香细胞、莴苣细胞、甜瓜细胞、豌豆细胞、南瓜细胞、覆盆子细胞、菠菜细胞、美洲南瓜细胞、草莓细胞、烟草细胞、西瓜细胞、甜玉米细胞、茄子细胞、葫芦细胞、秋葵细胞、木薯细胞和马铃薯细胞。在一个方面,植物细胞是被子植物细胞。在一个方面,植物细胞是裸子植物细胞。在一个方面,植物细胞是单子叶植物细胞。在一个方面,植物细胞是双子叶植物细胞。在一个方面,植物细胞是选自由以下组成的组的科的植物细胞:葱科、漆树科、伞形科、槟榔科、菊科、十字花科、槐科、葫芦科、杜鹃花科、豆科、胡桃科、锦葵科、含羞草科、桑科、芭蕉科、兰科、蝶形科、松科、禾本科、蔷薇科、芸香科、茜草科和茄科。本文所述的用于鉴定包含本文所述的可遗传编辑的等位基因的R0植物的方法可以与允许比较特定编辑的等位基因与样品中的靶位点处存在的其他等位基因的相对丰度(例如,通过比较读段数、信号强度等)的任何现在或未来现有技术一起使用。在一些实施方案中,可以使用桑格(Sanger)测序、鸟枪测序、片段长度分析(FLA)、单分子实时测序(PacBio)、离子激流测序、焦磷酸测序、边合成边测序(Illumina)、组合探针锚合成、边连接边测序(SOLiD测序)、纳米孔测序或GenapSys测序。
在一些实施方案中,片段长度分析(FLA)可以用于预测编辑的等位基因的遗传性。FLA是一种基于PCR的分子测定,可以用于鉴定影响在基因组编辑工具(诸如上文所述的序列特异性基因组修饰酶(或者蛋白质和/或向导RNA的复合物))切割后通过NHEJ介导的(非同源末端连接)DNA、微同源性介导的末端连接(MMEJ)或同源重组(HR)修复在靶位点处引入的扩增子大小的任何插入缺失(插入或缺失)编辑。FLA将PCR片段长度的变化与来自野生型参考的扩增子进行比较,以鉴定相对于野生型参考具有一个或多个插入缺失的样品。将来自编辑的细胞的基因组DNA与靶位点两侧的引物进行PCR反应以产生扩增子。然后将扩增子片段长度与野生型扩增子进行比较以鉴定突变体。对于FLA测定,可以使用5'FAM标记的引物、标准引物和聚合酶进行PCR反应以产生PCR片段。在一些实施方案中,可以使用校对聚合酶。在一些实施方案中,PCR产物在DNA测序仪(例如:ABI测序仪,Thermofischer,MA)上运行。在一些实施方案中,两个或更多个FLA反应可以多重进行,并且随后分析片段长度变化以鉴定在两个或更多个靶位点处具有插入缺失的扩增子。
在一些实施方案中,扩增子测序可以用于预测编辑的等位基因的遗传性。在一些实施方案中,Illumina的短扩增子测序(SASi)可以用于预测编辑的等位基因的遗传性。SASi可用于鉴定大约500个碱基对(bp)或更少的扩增子中的编辑。使用SASi,与参考序列相比,读段的开始和结束坐标是已知的。这种方法可以检测许多编辑,诸如插入、缺失、重复、倒位、置换以及它们的任何组合。在一些实施方案中,Illumina的长扩增子测序(LASi)可以用于预测编辑的等位基因的遗传性。LASi可用于鉴定大于大约500bp的扩增子中的编辑。根据各种因素,诸如从编辑的植物提取的DNA质量,通过LASi分析的扩增子可以长达大约10Kb。LASi类似于鸟枪基因组测序,因为与参考序列相比,读段长度以及各个读段的开始和结束坐标是随机的。参见例如图6。使用LASi,产生更大的扩增子,然后对扩增子进行剪切。对剪切片进行排序,并且通过将较小剪切片的序列拼接在一起来确定总序列。LASi可以用于鉴定许多编辑,诸如插入、缺失、倒位、易位、重复、置换以及它们的任何组合。在一些实施方案中,LASi可以用于表征跨越超过500bp基因组的基因组编辑,诸如在多个向导RNA靶位点的编辑、更大的插入、缺失、易位等。
对于Illumina测序平台,来自扩增子末端的测序读段质量较低。如果靶位点定位于读段的5'或3'末端的大约30个碱基对内,则可以通过采用重叠(配对)读段来减少测序误差。参见例如图5A。这种配对读段方法可以用于减少任何测序方法中的误差,其中在读段接近结束时序列质量较低。DSB或SSB在扩增子末端约30nt内的靶位点也具有引物结合位点被编辑缺失且未被检测到的风险。
在一些实施方案中,选择包含满足或超过所选的参考截止值的编辑的等位基因的R0植物用于进一步繁殖和分析。如本文所用,术语“参考截止值”是指表示来自靶序列的读段库中的特定编辑的等位基因的读段的百分比。在一些实施方案中,参考截止值选自由以下组成的组:约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%。在需要至少20%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过10%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少50%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过15%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少70%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过20%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少90%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过25%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少90%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过30%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少90%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过40%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在需要至少95%的编辑的等位基因遗传机会的一些实施方案中,选择包含满足或超过50%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。
在一些实施方案中,当可归因于编辑的等位基因的序列读段的数量等于或大于参考截止值时,编辑的等位基因被确定为具有高遗传可能性。在一些实施方案中,当可归因于编辑的等位基因的序列读段的数量小于10%参考截止值时,编辑的等位基因被确定为具有低遗传可能性。在一些实施方案中,不选择包含其中可归因于编辑的等位基因的序列读段的数量小于10%参考截止值的编辑的等位基因的R0植物用于进一步繁殖。在一些实施方案中,靶基因座处的编辑的等位基因的平均参考截止值可以用于确定选择用于进一步繁殖和分析的R0植物的数量。在其中靶基因座处的编辑的等位基因的平均参考截止值较小的一些实施方案中,选择较多的R0植物用于进一步繁殖和分析。在其中靶基因座处的编辑的等位基因的平均参考截止值较大的一些实施方案中,选择较少的R0植物用于进一步繁殖和分析。在其中所期望的靶位点处的编辑的等位基因小于所期望的参考截止值的一些实施方案中,选择更多的R0植物用于进一步繁殖。在另一个实施方案中,细胞从植物的一个或两个部分获得。在另一个实施方案中,植物部分选自由以下组成的组:叶、茎、根、花、果实以及它们的组合。在一个特定实施方案中,植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
在一些实施方案中,片段长度分析(FLA)可以用于预测编辑的等位基因的遗传性。在确定编辑的等位基因的遗传性时,FLA测定的噪声截止值设置为多于50%的测定植物具有至少一个假设噪声峰的高度的两倍。对应于小于噪声截止值四倍的峰的编辑的等位基因的遗传性是可变的。在其中对应于编辑的等位基因的峰小于噪声截止值四倍的一些实施方案中,选择更多的R0植物用于进一步繁殖和分析。在一些实施方案中,不选择包含对应于小于噪声截止值四倍的峰的编辑的等位基因的R0植物用于进一步繁殖和分析。在一些实施方案中,选择包含对应于噪声截止值至少四倍的峰的编辑的等位基因的R0植物用于进一步繁殖和分析。
在一些实施方案中,对应于小于或等于倍数截止值且大于噪声截止值的峰编辑的等位基因被确定为具有高遗传可能性。倍数截止值计算为n的1.25倍,其中n是靶位点处的等位基因数量。在一些实施方案中,选择包含对应于小于或等于倍数截止值且大于噪声截止值的峰的编辑的等位基因的R0植物用于进一步繁殖。在又一个实施方案中,根据扩增的靶序列中的插入和/或缺失的数量,当可归因于编辑的等位基因的序列读段的数量大于噪声截止值但小于参考截止值时,编辑的等位基因被确定为具有低遗传可能性。
如图2所示,在具有高置信度编辑峰的植物中,遗传性用FLA峰比率跟踪。高置信度峰大于或等于噪声截止值。FLA峰比率计算为最高峰的高度与所考虑的峰的高度之间的比率。如果FLA峰比率为小于或等于1.25,则对应于这种峰的100%的编辑的等位基因在下一代中被观察到。对应于FLA峰比率小于或等于2.5且大于1.25的峰的86%的编辑的等位基因在下一代中被观察到。在一些实施方案中,选择包含对应于具有小于或等于1.25的FLA峰比率的峰的编辑的等位基因的R0植物用于进一步繁殖。在一些实施方案中,选择包含对应于具有小于或等于2.5的FLA峰比率的峰的编辑的等位基因的R0植物用于进一步繁殖。在一些实施方案中,选择包含对应于具有小于或等于5的FLA峰比率的峰的编辑的等位基因的R0植物用于进一步繁殖。在一些实施方案中,不选择包含对应于具有大于5的FLA峰比率的峰的编辑的等位基因的R0植物用于进一步繁殖。在一些实施方案中,靶基因座处的编辑的等位基因的平均FLA峰比率可以用于确定选择用于进一步繁殖和分析的R0植物的数量。在其中靶基因座处的编辑的等位基因的平均FLA峰比率等于或大于5的一些实施方案中,选择更多的R0植物用于进一步繁殖和分析。在其中靶基因座处的编辑的等位基因的平均FLA峰比率小于2.5的一些实施方案中,选择较少的R0植物用于进一步繁殖和分析。在其中所期望的靶位点处的编辑的等位基因小于所期望的参考截止值的一些实施方案中,选择更多的R0植物用于进一步繁殖。
在一些实施方案中,提供了一种用于鉴定可遗传序列在植物中的方法。所述方法包括从植物获得细胞;从所述植物细胞提取和分离DNA;由DNA扩增靶序列;鉴定和定量扩增的靶序列中的编辑的等位基因;以及根据可归因于扩增的靶序列中的编辑的等位基因的读段的数量来预测编辑的等位基因的遗传性。在一些实施方案中,方法鉴定和定量插入和/或缺失。在一个替代性实施方案中,方法鉴定和定量易位和/或重复。在另一个替代性实施方案中,方法鉴定和定量两个或更多个插入、缺失、易位和重复。在另一个实施方案中,用于分析的细胞从R0植物的一个或多个部分获得。在一些实施方案中,植物部分选自由以下组成的组:叶、茎、根、花、果实以及它们的组合。在一个特定实施方案中,植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
在一些实施方案中,鉴定和定量编辑的等位基因通过片段长度分析或扩增子测序来进行。在一些实施方案中,用于选择R0植物的截止值大于噪声截止值四倍。
在一些实施方案中,提供了一种用于选择具有可遗传编辑的植物的方法。所述方法包括:从已经接触序列特异性基因组修饰酶(或者蛋白质和/或向导RNA的复合物)的植物获得细胞;从所述植物提取和分离DNA;由DNA扩增靶序列;确定靶序列处的特定编辑的频率;以及根据靶序列处的特定编辑的频率来选择植物。在另一个实施方案中,细胞从植物的一个或两个部分获得。在另一个实施方案中,植物部分选自由以下组成的组:叶、茎、根、花、果实以及它们的组合。在一个特定实施方案中,植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
在一些实施方案中,靶序列处的特定编辑的频率为至少约:10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%。在另一个实施方案中,方法还包括使植物繁殖。在又一个实施方案中,方法还包括将植物诸如与另一种植物杂交。在一个特定实施方案中,植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
在一些实施方案中,来自R0植物的细胞通过例如植物部分的打孔来获得,包括但不限于来自叶、茎、根、花和/或果实的打孔。或者,相关植物部分可以通过切割、修剪或者移除植物的一部分从植物中切除。然后可以通过从非细胞植物材料(诸如胞外基质(ECM))分离细胞来收获切除的植物组织的细胞。可以使用本领域熟知的技术制备从R0获得的细胞和组织用于分析。一旦从植物中获得所期望的细胞和/或组织,即可从细胞提取和分离DNA。通常在一些实施方案中,细胞膜用洗涤剂和/或表面活性剂裂解。不期望的蛋白质可以用蛋白酶除去。RNA可以通过RNA酶除去。其余的DNA可以被分离、清洁并用于分子生物学技术。DNA可以根据本领域已知的常规技术收获,包括乙醇沉淀、苯酚-氯仿提取和微离心柱纯化。然后提取和分离的DNA可以全部或部分扩增。在一个特定实施方案中,部分扩增的DNA包含DNA的靶序列。靶序列可以包括一个或多个基因、基因的一个或多个部分(包括外显子、内含子以及它们的部分和/或组合)、一个或多个转录元件和/或一个或多个不包括在基因中的序列。DNA扩增可以通过本领域已知的常规技术来完成。此类技术包括但不限于聚合酶链式反应(PCR)、连接酶链式反应和转录介导的扩增。
在另一个实施方案中,收获的细胞可以在体外培养以扩增或者加工细胞。培养的细胞可以是混合细胞群,诸如从植物中收获的,仅除去了ECM的那些细胞群。或者,可以进一步区分和分离培养的细胞。培养的细胞可以根据已知的培养技术在常规培养基中温育。通常,细胞培养基包含氨基酸、糖、维生素、盐、抗微生物剂和生长因子中的一者或多者。在一些实施方案中,可以诱导细胞形成愈伤组织。在一些实施方案中,可以从愈伤组织产生植物,这些植物可以被选择用于进一步繁殖和分析。
序列的遗传性的预测在上文有所讨论并且在以下实施例中举例说明。
现在将参考以下实施例来描述本公开。应当理解,这些实施例并非旨在将权利要求的范围限制于本公开;而是旨在作为某些实施方案的实施例。本领域的技术人员设想的示例性方法的任何变化旨在落入本公开的范围内。
实施例
实施例1
本实施例涉及FLA。基因组DNA从CRISPR-Cas12a和gRNA表达构建体转化的植物提取,这些构建体被设计为靶向预先选择的基因组靶位点。将提取的DNA与靶位点两侧的引物进行PCR反应以产生扩增子。然后将来源于引入基因组编辑工具的细胞的扩增子的片段长度与野生型(wt)参考扩增子进行比较,以鉴定插入或缺失编辑。根据制造商的说明,使用5'FAM标记的引物、标准引物和PhusionTM聚合酶(New England Biolabs,MA)进行PCR反应以产生PCR片段。将1μL PCR产物与0.5μL GeneScan 1200LIZ大小标准品(Thermo Fisher,MA)、8.5μL甲酰胺组合,并且在ABI测序仪(Thermo Fisher,MA)上运行。
数据分析如下。首先,计算每个测定的噪声截止值。对于测定中的每个样品,将峰从最高到最低高度进行排序。假设每个等位基因有1个峰,则假设具有最大高度的两个峰(在二倍体的情况下)来自那些等位基因,而任何其他峰都被假设是噪声。例如,对于二倍体植物中的单个基因座,第三高峰是噪声(每个等位基因1个+1个噪声)。对于二倍体植物中的两个基因座,第五高峰是噪声。类似地,对于四倍体植物,第五高峰是噪声(4个等位基因+噪声)。噪声截止值被设置为超过50%的测定植物具有一个假设噪声峰的高度的两倍。小于噪声截止值四倍的峰被认为是低置信度峰,因为该峰表示的序列的遗传性更加可变。这些低置信度峰通常与较差的DNA或测定质量相关。峰的最小允许高度为200。允许的最小大小为100个核苷酸。除预期wt大小的峰之外,存在于80%或更多的测定植物中的任何峰都被认为是未编辑的,因为它可能是同源物或常见的PCR伪影。在计算最大高度和噪声截止值之前,这些峰被删除。(参见图1(1C)中的“*”峰)。然而,由于使用模板指导编辑或由于微同源性对DNA修复的强偏爱性,预期编辑具有更均匀的大小,可以运行其他未编辑的参考植物来确定这种峰是否是编辑的植物独特的并且不存在于参考植物中。
倍数截止值计算为n的1.25倍,其中n是扩增的等位基因数量。对于多个基因座,可以按每个可能的等位基因1.25来计算倍数截止值。例如,具有两个等位基因的单个基因座的倍数截止值为2.5。具有两个等位基因的两个基因座的倍数截止值各自为五。类似地,对于四倍体植物,倍数截止值为5。这样,倍数截止值可以针对多个基因座或任何多倍体物种进行缩放。
FLA峰比率通过确定最大(最高)峰的高度与所考虑的峰的高度之间的比率来计算。对应于FLA峰比率小于或等于倍数截止值且大于噪声截止值的峰的编辑被预测为具有高遗传可能性(参见例如图1(1A))。对应于FLA峰比率大于倍数截止值但大于噪声截止值的峰的编辑被预测为具有低遗传可能性(参见例如图1(1B))。
对于具有高置信度编辑峰且测定仅跨越基因中的1个基因座的植物,遗传性用FLA峰比率跟踪(参见图2)。如果FLA峰比率小于或等于1.25,则100%的编辑的等位基因在下一代中被观察到。86%的FLA峰比率小于或等于2.5且大于1.25的编辑在下一代中也被观察到。由于高遗传率,FLA峰比率小于或等于倍数截止值且大于噪声截止值的编辑被鉴定为具有高遗传可能性的编辑(参见图1(1A))并且被选择用于繁殖。不选择具有FLA峰比率大于倍数截止值但大于噪声截止值的编辑的植物用于进一步繁殖,因为编辑被预测为具有低遗传可能性(参见图1(1B))。
实施例2
在本实施例中,通过FLA分析获得的数据使用以下公式转换为序列类似物百分比:
Figure BDA0003816541040000271
假设该植物仅有两个峰,2.5的FLA峰比率与约28%的测序读段相关。对于植物的子集,FLA峰比率和测序读段百分比之间高度一致,这表明可遗传编辑概念适用于扩增子测序。参见图3。
类似地,具有大于或等于25%序列类似物的等位基因(例如,FLA峰比率小于或等于2.5)具有高遗传可能性。这些等位基因的遗传率超过90%。参见图4。相比之下,具有编辑的等位基因的植物,其序列读段在所有序列读段的10%和15%之间(例如,FLA峰比率大于5等),以25%的遗传率进行遗传。
实施例3
多种方法可以用于定量编辑的等位基因。对于扩增子测序,描述了两种方法:SASi和LASi。对于SASi,产生大约150个碱基对的PCR扩增子。由于来自扩增子末端的测序读段往往质量较低,gRNA靶位点距读段的任一末端大约至少30个碱基对是优选的(参见图5(5B))。在靶位点定位于读段末端附近(大约30个碱基对或更少)的情况下,重叠读段(配对SASi)可以用于减少测序误差(参见图5(5A))。对于LASi,产生更长的扩增子并对该扩增子进行剪切(图6),并且通过标准测序技术对剪切的片段进行测序。DSB或SSB在扩增子末端约(~)30nt内的靶位点也具有引物结合位点被编辑缺失且未被检测到的风险。
SASi/LASi数据分析包括连接头修整和质量过滤、读段与参考的比对、编辑调用和接合性调用。图7显示了分析过程的工作流程700,样品编辑调用输出显示于图8中。在图8中,“S2d9”描述其中缺失开始于gRNA靶序列的第二个碱基并且缺失长度为九个核苷酸的编辑。类似地,“S-1d11”描述其中缺失开始于gRNA靶位点上游的一个碱基并且缺失长度为十一个核苷酸的编辑。
接合性可以从SASi或LASi数据确定。例如,可以应用10%的截止值,并且仅考虑读段频率大于或等于截止值的观察等位基因。表1列出了使用SASi和LASi数据进行接合性确定(或调用)的标准。图9提供了实施例8中描述的植物的接合性测定。例如,“嵌合,wt/-9/-8”表示具有野生型(wt)、9bp缺失(-9)和8bp缺失(-8)的嵌合接合性。“双等位基因”表示存在两个等位基因。
表1
Figure BDA0003816541040000291
已经提供了实施方案的前述描述用于说明和描述目的。这些描述的目的并不是详尽说明或限制本公开。特定实施方案的单个要素或特征通常不限于该特定实施方案,而是在适用的情况下是可互换的并且可以在所选的实施方案中使用,即使未具体示出或描述。相同内容也可以以多种方式变化。此类变化不应被视为背离本公开,并且所有此类修改旨在包括在本公开的范围内。
除非上下文另有说明,否则具体意思是本文所述的各种特征可以以任何组合使用。此外,本公开还设想,在一些实施方案中,可以排除或省略本文阐述的任何特征或特征组合。为了进行说明,如果说明书声明组合物包含组分A、B和C,则具体意思是A、B或C中的任一者或它们的组合可以单独或以任何组合被省略和放弃。
本文使用的术语仅出于描述特定示例性实施方案的目的,并且不旨在进行限制。如在描述和所附权利要求中所用,单数形式“一个”、“一种”和“所述”还旨在包括复数形式,除非上下文另有明确说明。同样如本文所用,“和/或”是指并且涵盖一个或多个相关列出项目的任何和所有可能的组合,以及在解释为替代方案(“或”)时不包括组合。
如本文所用,术语“约”在涉及可测量值诸如量或浓度等等时,意味着涵盖指定值的±10%、±5%、±1%、±0.5%或甚至±0.1的变化以及指定值。例如,“约X”,其中X是可测量值,意味着包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文提供的可测量值的范围可以包括其中的任何其他范围和/或单个值。如本文所用,短语诸如“在X和Y之间”和“在约X和Y之间”应解释为包括X和Y。如本文所用,短语诸如“在约X和Y之间”意指“在约X和约Y之间”,并且短语诸如“从约X至Y”意指“从约X至约Y”。此外,本文对给定参数的特定值和特定值范围的公开不排除在本文公开的一个或多个实例中可以有用的其他值和值范围。此外,可以设想,本文所述的特定参数的任何两个特定值可以定义可以适用于给定参数的值范围的端点(即,给定参数的第一值和第二值的公开可以被解释为以下公开:第一值和第二值之间的任何值也可以用于给定参数)。例如,如果参数X在本文中被示例为具有值A并且还被示例为具有值Z,则可以设想,参数X可以具有在约A至约Z的值范围。类似地,可以设想,参数的两个或更多个值范围的公开(无论这些范围是嵌套的、重叠的还是不同的)包括使用公开范围的端点可能要求保护的值的所有可能的范围组合。例如,如果参数X在本文中被示例为具有在1-10、或2-9、或3-8的范围内的值,则还设想,参数X可以具有其他值范围,包括1-9、1-8、1-3、1-2、2-10、2-8、2-3、3-10和3-9。
如本文所用,术语“包括”、“包含”和“含有”指定了所述特征、整数、步骤、操作、要素和/或组分的存在,但是不排除一个或多个其他特征、整数、步骤、操作、要素、组分和/或它们的组的存在或添加。如本文所用,过渡性短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中列举的具体材料或步骤,以及那些不会实质上影响要求保护的本发明的一个或多个基本和新特征的材料或步骤。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不应被解释为等同于“包括”。本文所述的方法步骤、过程和操作不应被解释为必然要求它们以所讨论或展示的特定顺序执行,除非被特别鉴定为执行的顺序。还应当理解,可以采用另外的或替代的步骤。
虽然本文中可以使用术语第一、第二、第三等来描述各种要素、组分、种子、成员和/或部分,但是这些要素、组分、种子、成员和/或部分不应受这些术语的限制。这些术语可以仅用于将一个要素、组分、种子、成员或部分与另一个要素、组分、种子、成员或部分区分开来。除非上下文明确指出,否则本文使用的术语诸如“第一”、“第二”和其他数值术语不暗示次序或顺序。因此,下文讨论的第一要素、组分、种子、成员或部分可以被称为第二要素、组分、种子、成员或部分,而不背离示例性实施方案的教导。

Claims (48)

1.一种用于鉴定可遗传序列在植物中的可能性的方法,所述方法包括:
使所述植物接触序列特异性编辑酶;
从编辑的植物获得细胞;
从所述植物提取和分离DNA;
由所述DNA扩增靶序列;
在扩增的靶序列库中鉴定和定量包含修饰的序列;以及
根据在所述扩增的靶序列库中的所述修饰的序列的丰度来预测修饰的序列的遗传性;
其中当所述修饰的序列的丰度等于或大于10%参考截止值时,所述修饰的序列被确定为具有高遗传可能性;
其中当所述修饰的序列的丰度小于10%参考截止值时,所述修饰的序列被确定为具有低遗传可能性。
2.一种用于鉴定可遗传序列在植物中的可能性的方法,所述方法包括:
使所述植物接触序列特异性编辑酶;
从编辑的植物获得细胞;
从所述植物提取和分离DNA;
由所述DNA扩增靶序列;
在扩增的靶序列库中鉴定和定量包含修饰的序列;以及
根据在所述扩增的靶序列库中的所述修饰的序列的丰度来预测修饰的序列的遗传性;
其中当所述修饰的序列的丰度大于噪声截止值但小于倍数截止值时,所述修饰的序列被确定为具有低遗传可能性。
3.如权利要求1或2所述的方法,其中所述细胞从所述植物的两个或更多个部分获得。
4.如权利要求3所述的方法,其中所述植物的部分选自由叶、茎、根、分生组织和生殖系组成的组。
5.如权利要求1或2所述的方法,其中所述植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
6.如权利要求1或2所述的方法,其中所述方法采用片段长度分析。
7.如权利要求6所述的方法,其中所述修饰的序列的丰度大于所述噪声截止值约四倍。
8.如权利要求1所述的方法,其中所述参考截止值选自约11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%。
9.如权利要求1所述的方法,还包括选择和繁殖包含具有高遗传可能性的序列的植物。
10.如权利要求1或2所述的方法,其中所述方法采用扩增子测序。
11.如权利要求10所述的方法,其中所述扩增子测序是短扩增子测序(SASi)或长扩增子测序(LASi)。
12.一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:
从每个R0植物获得细胞;
从所述每个R0植物提取和分离DNA;
由所述DNA产生包含靶位点的扩增子;
确定所选的编辑的等位基因的相对丰度;
选择其中所选的编辑的等位基因的相对丰度为至少约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的R0植物。
13.如权利要求12所述的方法,还包括繁殖所述所选的R0植物。
14.如权利要求13所述的方法,还包括使所述所选的R0植物杂交。
15.如权利要求13所述的方法,还包括使所述所选的R0植物自交。
16.如权利要求12所述的方法,其中所述细胞从所述R0植物的一个或多个部分获得。
17.如权利要求16所述的方法,其中所述植物的部分选自由叶、茎、根、花和分生组织组成的组。
18.如权利要求12所述的方法,其中所述植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
19.如权利要求12所述的方法,其中所述方法采用片段长度分析。
20.如权利要求12所述的方法,其中所述方法采用扩增子测序。
21.如权利要求20所述的方法,其中所述扩增子测序是短扩增子测序(SASi)或长扩增子测序(LASi)。
22.一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:
从每个R0植物获得细胞;
从所述每个R0植物提取和分离DNA;
由所述DNA产生包含靶位点的扩增子;
确定所述R0植物扩增子的FLA测定的所述噪声截止值;
选择包含对应于所述噪声截止值的至少四倍的峰的编辑的等位基因的R0植物。
23.如权利要求22所述的方法,还包括繁殖所述所选的R0植物。
24.如权利要求23所述的方法,还包括使所述所选的R0植物杂交。
25.如权利要求23所述的方法,还包括使所述所选的R0植物自交。
26.如权利要求22所述的方法,其中所述细胞从所述R0植物的一个或多个部分获得。
27.如权利要求26所述的方法,其中所述植物的部分选自由叶、茎、根、花和分生组织组成的组。
28.如权利要求22所述的方法,其中所述植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
29.一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:
从每个R0植物获得细胞;
从所述每个R0植物提取和分离DNA;
由所述DNA产生包含靶位点的扩增子;
确定所述R0植物扩增子的FLA测定的所述倍数截止值;
确定所述R0植物扩增子的FLA测定的所述噪声截止值;
选择包含对应于小于或等于所述倍数截止值且大于所述噪声截止值的峰的编辑的等位基因的R0植物。
30.如权利要求29所述的方法,还包括繁殖所述所选的R0植物。
31.如权利要求30所述的方法,还包括使所述所选的R0植物杂交。
32.如权利要求30所述的方法,还包括使所述所选的R0植物自交。
33.如权利要求29所述的方法,其中所述细胞从所述R0植物的一个或多个部分获得。
34.如权利要求33所述的方法,其中所述植物的部分选自由叶、茎、根、花和分生组织组成的组。
35.如权利要求29所述的方法,其中所述靶位点包含2个等位基因。
36.如权利要求29所述的方法,其中所述靶位点包含4个等位基因。
37.如权利要求29所述的方法,其中所述植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
38.一种用于选择具有可遗传编辑的等位基因的R0植物的方法,所述方法包括:
从每个R0植物获得细胞;
从所述每个R0植物提取和分离DNA;
由所述DNA产生包含靶位点的扩增子;
确定所述R0植物扩增子的FLA峰比率;
选择包含对应于小于或等于1、1.25、2.5或5的峰的编辑的等位基因的R0植物。
39.如权利要求38所述的方法,还包括繁殖所述所选的R0植物。
40.如权利要求39所述的方法,还包括使所述所选的R0植物杂交。
41.如权利要求39所述的方法,还包括使所述所选的R0植物自交。
42.如权利要求38所述的方法,其中所述细胞从所述R0植物的一个或多个部分获得。
43.如权利要求42所述的方法,其中所述植物的部分选自由叶、茎、根、花和分生组织组成的组。
44.如权利要求38所述的方法,其中所述靶位点包含2个等位基因。
45.如权利要求38所述的方法,其中所述靶位点包含4个等位基因。
46.如权利要求38所述的方法,其中所述植物选自由以下组成的组:玉米植物、水稻植物、高粱植物、小麦植物、苜蓿植物、大麦植物、小米植物、黑麦植物、甘蔗植物、棉花植物、大豆植物、芸苔植物、番茄植物、洋葱植物、胡椒植物、黄瓜植物、拟南芥植物、小米植物、豆类植物、黑莓植物、西兰花植物、卷心菜植物、胡萝卜植物、花椰菜植物、茴香植物、莴苣植物、甜瓜植物、豌豆植物、南瓜植物、覆盆子植物、菠菜植物、美洲南瓜植物、草莓植物、烟草植物、西瓜植物、甜玉米植物、茄子植物、葫芦植物、秋葵植物、木薯植物和马铃薯植物。
47.一种用于确定R0植物的接合性的方法,所述方法包括:从每个R0植物获得细胞;从所述每个R0植物提取和分离DNA;由所述DNA产生包含靶位点的扩增子;确定所述靶位点处的所述等位基因的所述FLA峰比率;以及选择其中此类等位基因的所述FLA峰比率为至少约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的那些等位基因。
48.一种R0植物的子代植物,所述R0植物是根据权利要求12、22、29、38或47所述的方法选择的。
CN202180017067.4A 2020-02-27 2021-02-26 用于选择可遗传编辑的方法 Pending CN115209724A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062982523P 2020-02-27 2020-02-27
US62/982,523 2020-02-27
PCT/US2021/019787 WO2021173909A1 (en) 2020-02-27 2021-02-26 Methods for selecting inheritable edits

Publications (1)

Publication Number Publication Date
CN115209724A true CN115209724A (zh) 2022-10-18

Family

ID=77490327

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180017067.4A Pending CN115209724A (zh) 2020-02-27 2021-02-26 用于选择可遗传编辑的方法

Country Status (6)

Country Link
US (1) US20230083583A1 (zh)
EP (1) EP4110043A4 (zh)
CN (1) CN115209724A (zh)
AU (1) AU2021227928A1 (zh)
CA (1) CA3173278A1 (zh)
WO (1) WO2021173909A1 (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050053975A1 (en) * 2003-05-22 2005-03-10 Dow Agrosciences, Llc High-throughput methods of screening DNA for deletions and other mutations
WO2005024068A2 (en) * 2003-09-05 2005-03-17 Sequenom, Inc. Allele-specific sequence variation analysis
US20050112590A1 (en) * 2002-11-27 2005-05-26 Boom Dirk V.D. Fragmentation-based methods and systems for sequence variation detection and discovery
WO2005059692A2 (en) * 2003-12-12 2005-06-30 Correlagen, Inc. Processing and managing genetic information
US20070141614A1 (en) * 2005-12-15 2007-06-21 Macaulay Land Research Institute Of Craigiebuckler Genetic process for multiplex terminal restriction fragment length polymorphism analysis
EP2341151A1 (en) * 2005-04-12 2011-07-06 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
WO2018165249A1 (en) * 2017-03-07 2018-09-13 The Regents Of The University Of California Gene editing and transgene free mutant plants
US20180305756A1 (en) * 2014-08-13 2018-10-25 Progenika Biopharma S.A. Consensus-based allele detection
CN108866225A (zh) * 2018-06-21 2018-11-23 江汉大学 一种遗传修饰水稻遗传背景的筛查方法
CN112203505A (zh) * 2018-05-24 2021-01-08 孟山都技术公司 植物基因组编辑

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050112590A1 (en) * 2002-11-27 2005-05-26 Boom Dirk V.D. Fragmentation-based methods and systems for sequence variation detection and discovery
US20050053975A1 (en) * 2003-05-22 2005-03-10 Dow Agrosciences, Llc High-throughput methods of screening DNA for deletions and other mutations
WO2005024068A2 (en) * 2003-09-05 2005-03-17 Sequenom, Inc. Allele-specific sequence variation analysis
WO2005059692A2 (en) * 2003-12-12 2005-06-30 Correlagen, Inc. Processing and managing genetic information
EP2341151A1 (en) * 2005-04-12 2011-07-06 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
US20070141614A1 (en) * 2005-12-15 2007-06-21 Macaulay Land Research Institute Of Craigiebuckler Genetic process for multiplex terminal restriction fragment length polymorphism analysis
US20180305756A1 (en) * 2014-08-13 2018-10-25 Progenika Biopharma S.A. Consensus-based allele detection
WO2018165249A1 (en) * 2017-03-07 2018-09-13 The Regents Of The University Of California Gene editing and transgene free mutant plants
CN112203505A (zh) * 2018-05-24 2021-01-08 孟山都技术公司 植物基因组编辑
CN108866225A (zh) * 2018-06-21 2018-11-23 江汉大学 一种遗传修饰水稻遗传背景的筛查方法

Also Published As

Publication number Publication date
EP4110043A1 (en) 2023-01-04
WO2021173909A1 (en) 2021-09-02
EP4110043A4 (en) 2024-05-22
CA3173278A1 (en) 2021-09-02
US20230083583A1 (en) 2023-03-16
AU2021227928A1 (en) 2022-09-15

Similar Documents

Publication Publication Date Title
US20200024610A1 (en) Method for selecting target sites for site-specific genome modification in plants
RU2745987C2 (ru) Способы и композиции для получения укороченных растений кукурузы
JP7273033B2 (ja) バナナの貯蔵寿命を延長するための組成物及び方法
US10945391B2 (en) Yield traits for maize
US20230270067A1 (en) Heterozygous cenh3 monocots and methods of use thereof for haploid induction and simultaneous genome editing
US11781192B2 (en) Double-flowering dwarf Calibrachoa
US20210210163A1 (en) Systems and methods for improved breeding by modulating recombination rates
US20220282339A1 (en) Genetic purity estimate method by sequencing
US20230083583A1 (en) Methods for selecting inheritable edits
CN113544277A (zh) 用于驱动t1事件多样性的组合物和方法
Grotewold et al. Plant genes, genomes and genetics
EP3984355B1 (en) Double-flowering dwarf calibrachoa
US20220186243A1 (en) Cannabis plants with improved yield
US20220315986A1 (en) Processes for enriching desirable elements and uses therefor
US20210071192A1 (en) Methods to evaluate traits
Yuan et al. Development and Identification of Expressed Sequence Tag-based SSR Markers Associated with the Heterostyly Trait in Primula forbesii
WO2023111225A1 (en) Double decapitation of plants
WO2024124509A1 (en) Maize plants comprising resistance to southern leaf blight and compositions and methods for selecting and producing the same
WO2023199304A1 (en) Controlling juvenile to reproductive phase transition in tree crops
WO2022241461A1 (en) Modified autoflower cannabis plants with value phenotypes
Lin CRISPR/Cas9-Based Editing of Alpha-Amylase 3 (Amy3) Genes in Wheat
CN118284331A (zh) 香蕉果实褐变的延缓或预防

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination